在AWS EMR上搜索时“找不到有效的SPARK_主页”

Could not find valid SPARK_HOME while searching ['/mnt1/yarn/usercache/hadoop/appcache/application_x_0001', '/mnt/yarn/usercache/hadoop/filecache/11/pyspark.zip/pyspark', '/mnt1/yarn/usercache/hadoop/appcache/application_x_0001/container_x_0001_01_000002/pyspark.zip/pyspark', '/mnt1/yarn/usercache/hadoop/appcache/application_x_0001/container_x_0001_01_000002']

1条回答

网友

1楼 · 发布于 2024-05-14 21:00:06

最后，我发现导致此错误的原因是试图从运行在内核上且不属于主脚本的函数调用spark上下文对象，而该对象已在主脚本中创建。显然是下面的命令

from pyspark import SparkContext
sc = SparkContext.getOrCreate()

创建新的SparkContext对象，即使它已在主节点上的主脚本中创建。因此，为了防止此问题，如果必须在非主脚本的脚本中使用sparkContext，则必须将其从主脚本显式导出/导入到副脚本（例如，作为函数的参数），以避免以下问题

相关问题更多 >

编程相关推荐

热门问题

热门文章