是否可以在docker下运行spark udf函数(主要是python)?

2024-05-01 22:10:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在pyspark上使用emr。为了简化python库和依赖项的设置,我们使用了docker图像。你知道吗

这对于一般的python应用程序(非spark)和spark驱动程序(从docker映像中调用spark submit)都很好

但是,我找不到一个方法使worker在docker映像中运行(要么是“full”worker,要么只是UDF函数)

编辑 找到了一个解决方案与测试版电子病历,如果有一些替代与当前(5.*)电子病历版本它仍然是相关的


Tags: 方法函数docker图像应用程序驱动程序电子full