如何将整个数据目录与RD同步

2024-05-13 01:32:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我的目标是总是自动复制一个带有RDS(MSSQL)模式的S3 bucket

我有一个胶水爬虫是由一个lambda函数在每个S3上传触发。因此,数据目录总是与S3同步。我能够创建自动从目录上传特定表的粘合作业。 如果用户上载了一个包含新列的新表,我必须手动为该表创建一个新作业。有没有办法使这个手动步骤自动化


Tags: 数据lambda函数用户目录目标s3bucket
1条回答
网友
1楼 · 发布于 2024-05-13 01:32:26

如果您想在爬虫发现新表时触发一些逻辑,我建议您考虑为Glue服务中的状态更改创建Cloudwatch Event Rule。具体来说,您可以在数据目录数据库或表的状态更改时调用服务(即Lambda函数)

此lambda函数可以检查状态更改事件,并使用其中一个SDK为新表创建作业

相关问题 更多 >