打包虚拟/conda环境以用于EMR引导程序

2024-04-25 00:33:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在使用PythonPython,但也做了许多包升级(如熊猫)。我已经编写了一些工具,我想把它们转换成MapReduce作业,还研究了如何为包依赖性进行python EMR引导。在

我考虑了一个可能的解决办法:只需获取并安装Python分布。但后来我想起我必须做所有必要的升级。在

我的最后一个努力是让这个问题变得简单:有没有一种方法可以“重新处理”升级后的水蟒(或者它的一个环境),这样它就可以存储在S3上并在EMR引导操作中使用?在

谢谢你的帮助!在

补充:我想它需要一个许可证,才能像这样打包一个Python发行版,并在各种机器上使用它,无论是在我的办公网络中还是在AWS上。下面是这个问题的一个开源版本(我刚刚了解到Anaconda发行版的主包管理器实际上是OS):

假设我有一个虚拟(或conda)环境,运行时安装了各种模块和扩展。封装/捆绑这个虚拟环境的正确方法是什么(如果有的话),以便我可以根据需要高效地部署它?我遇到了“pip bundle”,还有“conda clone”和“conda create”。此外,还出现了康达频道的概念。只是我不清楚我是否能把这些放在一起,以便在EMR上高效地部署,如果可以,如何。在


Tags: 工具方法机器s3环境部署作业conda