为EC上的数据处理项目设置docker容器的最佳实践

2021-10-17 17:54:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在创建数据处理管道的上下文中对AWS弹性容器服务进行一些实验,对于如何最好地设置docker容器/ecs任务定义,我有一些问题。你知道吗

该项目的总体目标是创建一个系统,允许用户使用S3事件和Lambda将数据文件添加到S3 bucket以触发ECS任务,然后将输出返回到另一个S3 bucket。你知道吗

到目前为止,我已经能够理解S3触发器和Lambda的基础知识,但是对于如何正确设置docker容器和任务定义,以便它使用一组python脚本自动处理数据,我有点困惑。我相信创建一个docker容器来运行一个shell脚本来复制必要的文件并调用python代码是有意义的,但是我对如何使用ECS任务中的绑定装载卷来运行docker容器以及这个过程是否有意义感到困惑。目前,当我在单个EC2上测试系统时,我使用以下方法运行docker容器:

docker run -b $ (pwd)/data:/home/ec2-user/docker_test/data docker_test

我对AWS工具还比较陌生,所以请告诉我是否可以澄清我的任何观点/问题,并提前感谢您!你知道吗