数据工程用例的通用实用函数

hip-data-tools的Python项目详细描述


HIP数据工具

版权所有Hipages Group Pty Ltd 2019

PyPI versionCircleCI

用于数据工程、etl、探索等的常用python工具和实用程序。 该软件包上载到PYPI,以便在各种环境中轻松下载和使用,例如(但不限于):

  1. 运行生产工作负载
  2. 类似于笔记本电脑的ML培训
  3. 用于开发和探索的本地机器

安装

从pypi repo安装:

pip3 install hip-data-tools

从源安装

pip3 install .

连接到AWS

您需要实例化一个aws连接:

fromhip_data_tools.authenticateimportAwsConnectionconn=AwsConnection(mode="assume_role",settings={"profile_name":"default"})# OR if you want to connect using Env Vars:conn=AwsConnection(mode="standard_env_var",settings={})# OR if you want custom set of env vars to connectconn=AwsConnection(mode="custom_env_var",settings={"aws_access_key_id_env_var":"aws_access_key_id","aws_secret_access_key_env_var":"aws_secret_access_key"})

使用此对象连接,您可以使用aws实用程序,例如aws athena:

fromhip_data_tools.aws.athenaimportAthenaUtilau=AthenaUtil(database="default",conn=conn,output_bucket="example",output_key="tmp/scratch/")result=au.run_query("SELECT * FROM temp limit 10",return_result=True)print(result)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在扩展类中将Java重写为抽象的非抽象方法   java可滚动视图   java Android:隐藏操作栏,保持标签   java如何在Hibernate中使用@Qualifier   java如何在spring MVC中进行Http会话管理以获取数据库中的数据   java如何为TictaToe游戏创建HashMap   java在消息资源文件中查找未使用的值   从源代码构建Kafka时发生java错误   c中的java调用optaplanner DLL#   无法通过Java API访问orientdb函数   任务的java执行失败“:app:ProcessDebuggGoogleService”   java在整个模拟过程中保持代理之间的距离不变   如何在Java中使用BouncyCastle PGP实用程序实现增量加密?   java在安卓中计算画布点的距离   Java回文修订   java在Firebase数据库中存储变量的必要性   java如何使用gquery手势插件在页面上启用文本突出显示?   java如何在Apache camel中使用POST调用REST?