数据工程用例的通用实用函数

hip-data-tools的Python项目详细描述


HIP数据工具

版权所有Hipages Group Pty Ltd 2019

PyPI versionCircleCI

用于数据工程、etl、探索等的常用python工具和实用程序。 该软件包上载到PYPI,以便在各种环境中轻松下载和使用,例如(但不限于):

  1. 运行生产工作负载
  2. 类似于笔记本电脑的ML培训
  3. 用于开发和探索的本地机器

安装

从pypi repo安装:

pip3 install hip-data-tools

从源安装

pip3 install .

连接到AWS

您需要实例化一个aws连接:

fromhip_data_tools.authenticateimportAwsConnectionconn=AwsConnection(mode="assume_role",settings={"profile_name":"default"})# OR if you want to connect using Env Vars:conn=AwsConnection(mode="standard_env_var",settings={})# OR if you want custom set of env vars to connectconn=AwsConnection(mode="custom_env_var",settings={"aws_access_key_id_env_var":"aws_access_key_id","aws_secret_access_key_env_var":"aws_secret_access_key"})

使用此对象连接,您可以使用aws实用程序,例如aws athena:

fromhip_data_tools.aws.athenaimportAthenaUtilau=AthenaUtil(database="default",conn=conn,output_bucket="example",output_key="tmp/scratch/")result=au.run_query("SELECT * FROM temp limit 10",return_result=True)print(result)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
graph Java自己生成类图   java MouseMotionListener:鼠标和触控板给出不同的结果   java解析清单条目的正确方法是什么。jar中的mf文件?   java如何创建带有半透明色块的透明gif/png图像?   java应用内计费V3:跨设备同步购买   java Spring数据JPA注入失败BeanCreationException:无法自动连接字段   Java数据结构维护插入顺序和重复值   java无法在VSCode中设置JavaFX   java中数据字段初始化的类顺序   java如何使用ClientBuilder为Rest Post Api多部分编写集成测试   JUnit测试divide()方法的java正确方法   java将消息标记为接收前已读   Java ArrayList调用扩展对象函数   java Android:只使用GCM的TCP/IPServer   Java如何将xls数据转换为txt文件   编译为Jar文件后未找到java类   java返回子字符串的所有匹配项   java Get json用户_timeline api twitter 1.1