从第三方api到雪花的etl

mr-plow的Python项目详细描述


犁先生

Plow先生是Poppin的ETL系统,将来自第三方API的数据持久化到 雪花数据库,用于以后的业务分析。

我们使用python来:

  1. 调用上述api并将数据存储在aws s3中("extract")
  2. 发出snowflake命令从aws s3("stage")导入数据
  3. 发出snowflake命令以从原始数据转换新数据 非结构形式到用于分析的表格形式("转换")
  4. 发出snowflake命令将新的表格数据加载到我们的主存, 消除任何重复("加载")
  5. < > >

    Plow先生可以从命令行运行。今后我们将增加支持 作为aws lambda函数运行它的函数。

    为什么叫这个可笑的名字?

    有两个原因。

    首先,这主要是一个雪花客户端。

    第二个: https://www.youtube.com/watch?V=UYXET7XOH1M

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Selenium Web驱动程序。负载策略不稳定   JAVAsql。SQLException:没有合适的驱动程序无法创建“oracle”类的JDBC驱动程序。jdbc。驾驶员用于连接URL的OracleDriver   java谷歌地图“优化路径点”如何解决旅行推销员的问题?   java这段代码可能会造成潜在的内存泄漏吗?   java更改JCombobox的高度   java如何清除jtable中的数据   JavaHadoop:错误安全性。UserGroupInformation:MapReduce程序中的PriviledgedActionException   java如何将sonarlint添加到gradle任务中?   性能为什么Java排序优于原语计数排序   java Spring属性PlaceHolderConfigure从数据库加载   java从泛型获取类不起作用   java Spring@Transactional传播属性   java试图拥有主菜单和子菜单类   XSL的java后处理步骤   java第一个字母和最后一个字母、第二个字母和倒数第二个字母之间的差值之和,依此类推,直到单词的中心   switch语句在Java中的下一个出发点   java 安卓如何在OnBackpress()时设置viewpager的特定项目位置?