从第三方api到雪花的etl

mr-plow的Python项目详细描述


犁先生

Plow先生是Poppin的ETL系统,将来自第三方API的数据持久化到 雪花数据库,用于以后的业务分析。

我们使用python来:

  1. 调用上述api并将数据存储在aws s3中("extract")
  2. 发出snowflake命令从aws s3("stage")导入数据
  3. 发出snowflake命令以从原始数据转换新数据 非结构形式到用于分析的表格形式("转换")
  4. 发出snowflake命令将新的表格数据加载到我们的主存, 消除任何重复("加载")
  5. < > >

    Plow先生可以从命令行运行。今后我们将增加支持 作为aws lambda函数运行它的函数。

    为什么叫这个可笑的名字?

    有两个原因。

    首先,这主要是一个雪花客户端。

    第二个: https://www.youtube.com/watch?V=UYXET7XOH1M

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java ParsePushReceiver参数   java如何从设备读取完整数据?   java将java_设置为home,但忽略错误   java如何从歌曲中对专辑进行排序?   java libnaude+windows 10 x64+Eclipse   java如何将maven目标更改为如图所示的想法中的quickicon?   java swing布局中心面板,可滚动显示多个窗口窗格   使用MOSQUITO代理的mqtt中的java SSL   java如何通过属性值获取XML字符串   java在服务器每次启动时停止GWT编译   java如何让javac搜索类路径的子目录?   可以比较java中的两个不同类吗?   JAVAAndroid活动内部类中的lang.NoClassDefFoundError   java HttpServletRequest获取请求头参数块   C++socket与java客户端的连接   java如何在Apache commons http客户端上使用SSL客户端证书   使用预编译正则表达式模式提高java速度   JavaRhino将两个已编译脚本合并为一个脚本