没有项目描述
datafs的Python项目详细描述
datafs是一个数据包管理器。它为个人或大型组织管理文件版本、依赖项和元数据。
使用规范文件配置和连接元数据Manager和多个数据Services,您将在几秒钟内共享、跟踪和使用数据。
- 自由软件:麻省理工学院许可证
- 文档:https://datafs.readthedocs.io。
功能
- 团队的显式版本和元数据管理
- 跨文件系统的统一读/写接口
- 方便地为用户创建现成的配置文件
- 跟踪数据依赖关系和使用日志
- 使用来自python或命令行的数据文件
- 由经理和服务处理的权限,使您可以控制用户访问
用法
首先,configure an API。别担心。还不错。查看quickstart以继续。
我们假设已经创建了一个api对象并将其附加到一个名为“local”的服务。一旦有了它,就可以开始使用数据文件来创建和使用归档文件。
$ datafs create my_new_data_archive --description "a test archive" created versioned archive <DataArchive local://my_new_data_archive> $ echo"initial file contents" > my_file.txt $ datafs update my_new_data_archive my_file.txt $ datafs cat my_new_data_archive initial file contents
版本被显式跟踪。在写入和读取旧版本时碰撞版本 如果需要的话。
$ echo"updated contents" > my_file.txt $ datafs update my_new_data_archive my_file.txt --bumpversion minor uploaded data to <DataArchive local://my_new_data_archive>. version bumped 0.0.1 --> 0.1. $ datafs cat my_new_data_archive updated contents $ datafs cat my_new_data_archive --version 0.0.1 initial file contents
使用需求文件设置默认版本的pin版本
$ echo"my_new_data_archive==0.0.1" > requirements_data.txt $ datafs cat my_new_data_archive initial file contents
所有这些功能都可以从python获得(在python中速度更快):
>>>importdatafs>>>api=datafs.get_api()>>>archive=api.get_archive('my_new_data_archive')>>>witharchive.open('r',version='latest')asf:...print(f.read())...updatedcontents
如果你有删除档案的权限,这很容易做到。有关设置权限的提示,请参见administrative tools。
$ datafs delete my_new_data_archive deleted archive <DataArchive local://my_new_data_archive>
有关更广泛的用例,请参见examples。
安装
pip install datafs
此外,您还需要一名经理和服务:
经理:
- MongoDB:^{TT2}$
- 发电机:pip install boto3
服务:
- 开箱即用:
- 本地
- 共享
- 已安装
- 拉链
- ftp
- http/https
- 内存中
- 需要附加软件包:
- aws/s3:pip install boto
- sftp:pip install paramiko
- xmlrpc:pip install xmlrpclib
要求
目前,datafs需要python 2.7。我们正在研究3倍的支持。
待办事项
请参见issues以查看并添加到我们的待办事项中。
学分
这个包是由Justin Simcock和Climate Impact Lab的Michael Delgado创建的。在github上查看我们。
对PyFilesystem的人们的重大荣誉。还要感谢audreyr提供的精彩cookiecutter软件包,感谢Pyup,这是一个源源不断的灵感来源,也是我们沉默的第三个贡献者。