数据加载和编目系统
intake的Python项目详细描述
进气:加载数据的通用接口
Intake是一组轻量级工具,用于在数据科学项目中加载和共享数据。 摄入帮助您:
- 将各种格式的数据(参见current list of known plugins)加载到您已经知道的容器中,如pandas数据帧、python列表、numpy数组等。
- 将样板数据加载代码转换为可重用的进气插件
- 描述目录文件中的数据集,以便在项目之间和与其他项目共享。
- 通过网络与接收服务器共享目录信息(和数据集)
文档可在Read the Docs获得。
有关此回购协议和其他相关项目的每周新闻,请访问 wiki
安装
使用conda的推荐方法:
conda install -c conda-forge intake
您也可以使用pip
安装,在这种情况下,您可以选择
您安装的依赖项,最简单的具有最少的要求
pip install intake
以及附加的部分[server]
、[plot]
和[dataframe]
,或者包括所有内容:
pip install intake[complete]
注意,您很可能需要特定的驱动程序和其他插件,它们通常有额外的 他们自己的依赖。
开发
- 创建开发python环境,最好使用
conda
。这些要求可以在 此回购协议的conda/
目录或姐妹目录中的配方 feedstock - 使用
pip install -e .[complete]
安装
- 将
pytest
添加到环境中,以便能够运行测试 - 在github上创建一个fork以提交prs。
- 我们尊重但不强制执行PEP8标准;所有新的代码都应该包含在测试中。