对数据源进行编码

akagi的Python项目详细描述


https://img.shields.io/pypi/v/akagi.svghttps://img.shields.io/travis/ayemos/akagi.svghttps://readthedocs.org/projects/akagi/badge/?version=latesthttps://pyup.io/repos/github/ayemos/akagi/shield.svghttps://codeclimate.com/github/ayemos/akagi/badges/coverage.svg

赤木

  • 自由软件:麻省理工学院许可证

功能

akagi使您能够从python访问各种数据源,如amazon redshift、amazon s3和google电子表格(以后会有更多)。

安装

通过PIP安装:

pip install akagi

或来源:

$ git clone https://github.com/ayemos/akagi akagi
$ cd akagi
$ python setup.py install

设置

要使用redshiftdatasource,需要设置环境变量akagi_unload_bucket 您喜欢用作redshift unload命令的中间存储的amazon s3存储桶。

$ export AKAGI_UNLOAD_BUCKET=xyz-unload-bucket.ap-northeast-1

要使用SpreadsheetDetaSource,您需要将环境变量google_application_credential设置为 指示您的服务帐户凭据文件。您可以从here获取凭据。

关联的客户端必须具有对工作表的读取权限。

$ export GOOGLE_APPLICATION_CREDENTIAL=$HOME/.credentials/service-1a2b.json

示例

红移数据源

fromakagi.data_sourcesimportRedshiftDataSourceds=RedshiftDataSource('select * from (select user_id, path from logs.imp limit 10000')fordinds:print(d)# iterate on result

s3数据源
fromakagi.data_sourcesimportS3DataSourceds=S3DataSource.for_prefix('image-data.ap-northeast-1','data/image_net/zebra',file_format='binary')fordinds:print(d)# iterate on result

电子表格数据源
fromakagi.data_sourcesimportLocalDataSourceds=SpreadsheetDataSource('1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms',# sample sheet provided by Googlesheet_range='Class Data!A2:F31')fordinds:print(d)# iterate on result

本地数据源

fromakagi.data_sourcesimportLocalDataSourceds=LocalDataSource('./PATH/TO/YOUR/DATA/DIR',file_format='csv')fordinds:print(d)# iterate on result

学分

这个包是用Cookiecutteraudreyr/cookiecutter-pypackage项目模板。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何将数据从浏览器拖放到具有自定义MIME类型的java swing应用程序中?   java JMockit:如何模拟受保护的方法?   java为什么待办事项已满时服务器socket连接未被拒绝?   java我应该如何并行化计算代价高昂的for循环并整理迭代结果?   java如何以不同的方式编写这部分代码?   java代码没有看到JTextField的值,尽管它显示在接口中   java我对Spring boot中的bean有问题   java在客户端使用CometD获取传输和EOF异常   如何在Java libGDX中正确地为游戏添加示意图   java捕获异常类型两次   java有没有办法在systemPath中使用变量来实现systemscope依赖关系?   在Java中导入多个类文件   java在Visual Studio代码中配置JDK   java我需要帮助在for循环中使用大写这个词,这个词不是用eclipse编写的,而是从txt文件导入的   JAVAutil。scanner类Java读取的输入值太多   java REST Web服务是否支持提供zip文件的范围标头?   java在java代码中生成安全的SQL