这个问题与理解DockerRoperator和Apache Airflow有关,所以我不确定这个站点是否正确。如果没有,请让我知道我可以张贴在哪里
情况如下:我使用的是一台Windows笔记本电脑,我开发了一个非常基本的ETL管道,可以从某个服务器提取数据,并使用ApacheAirflow定期将未处理的数据写入MongoDB。我有一个带有三个服务的docker-compose.yml
文件:MongoDB的mongo服务,MongoExpress服务作为MongoDB的管理工具,ApacheAirflow的webserver服务和ApacheAirflow的postgres服务作为数据库后端
到目前为止,我已经在函数中开发了一些Python代码,这些函数正在由Airflow实例使用PythonOperator调用。由于使用PythonOperator进行调试非常困难,因此我现在想尝试DockerPerator。我一直在关注这个tutorial,它声称使用DockerPropertor,您可以开发独立于操作系统的源代码,因为Docker的概念是“构建一次,到处运行”
我的问题是,我没有完全理解使用DockerRoperator运行代码所需的所有必要步骤。在本教程中,我有以下关于任务开发和部署的问题:
谢谢你的时间,我非常感谢
通常,您将拥有一个Docker映像,用于处理一个类型的任务。因此,对于任何一个管道,您可能会使用各种不同的Docker图像,每个步骤使用一个不同的图像
关于您的问题,这里有几个考虑因素,特别是关于部署的问题
DockerOperator
默认为图像上的latest
标记李>如果您已经构建了映像,并且可以访问,则只需使用
DockerOperator
创建一个任务,如下所示:我建议你花点时间去了解Docker。刚开始的时候有点困难,但这是一个非常有价值的工具,特别是对于像气流这样的系统
相关问题 更多 >
编程相关推荐