AWS Glue与Python集成

1条回答

网友

1楼 · 发布于 2024-04-20 06:26:27

在使用AWS glue时，您需要考虑的最重要的一件事是，它是一个基于spark的无服务器环境，并带有扩展。这意味着您需要将脚本调整为类似于pySpark。如果您同意，那么可以按照AWS Glue Documentation中的说明使用外部python库

如果您已经运行了脚本，并且不想使用Spark，那么可以考虑使用AWS数据管道。它是一种以更多方式运行数据转换的服务，而不仅仅是Spark。不利的一面是，AWS数据管道是任务驱动的，而不是数据驱动的，这意味着没有目录或模式管理。在

如果您想在Python中使用AWS数据管道，在阅读文档时并不明显，但是这个过程基本上是将一个shell文件转移到S3中，其中包含设置Python环境和调用脚本的说明。然后为管道配置调度，AWS将负责在需要时启动虚拟机，然后停止运行。你有一个good post at stackoverflow about this

相关问题更多 >

编程相关推荐

热门问题

热门文章

AWS Glue与Python集成

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >