实用数据集管理

sefara的Python项目详细描述


sefara是一个用于管理数据集的python库。它提供了一种方法来指定数据集是什么(通常是文件系统路径)和任何元数据(例如它们来自哪个实验),然后在分析脚本和笔记本中方便地引用它们。

sefara不会假设数据集是什么,它们是什么格式,或者是如何访问它们的。

快速示例

通过创建这样的文件来定义一个“资源集合”,我们称之为datasets.sefara.py

from sefara import export

export(
    "my_first_dataset.hdf5",
    path="/path/to/file1.hdf5",
    tags=["first", "important"],
)
export(
    "my_second_dataset.csv",
    path="/path/to/file2.csv",
    tags=["second", "unimportant"],
)

然后,使用sefara在python中打开它:

>>> import sefara
>>> datasets = sefara.load("datasets.sefara.py")
>>> print(datasets.filter("tags.important")[0].path)
/path/to/file1.hdf5

安装

pip install sefara

运行测试:

nosetests

构建文档:

pip install -e .
pip install Sphinx
cd docs
make clean setup rst html

文档将写入_build/html目录。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
NetBeans中的Java Swing滚动窗格   java如何与具有复合键的表建立关系?   Android中读取文件时java数据丢失   java黄瓜场景。embed在ubuntu机器上不工作?   java从spring mvc控制器操作中,我如何获得请求/响应的访问权限?   java减去两个长值   java选择下一个值firebase 安卓   用于起始和结尾连字符的java正则表达式   Java正则表达式解释   java Lifefay freemarker ADT:方法不可用?   java我怎样才能让我的开关盒作用于JFrame?   java在我的场景中使用连接池的理想方式是什么   java我如何接受jsoup的cookies?   java如何将整数数组更改为字符串数组?   java Android操作\u指针\u向上直到剩余触摸移动时才调用   java为什么gradle会出错?   io如何在java中复制/拆分输入流?   java使JButton不可见,但尊重其原始空间   java Spring提交表单获取复选框值不起作用