我想在我的MacBookAir上运行pyspark。当我尝试启动它时,我会得到错误:
Exception: Java gateway process exited before sending the driver its port number
当启动时调用sc=SparkContext()时。我尝试运行以下命令:
./bin/pyspark
./bin/spark-shell
export PYSPARK_SUBMIT_ARGS="--master local[2] pyspark-shell"
没有用。我也看过这里:
Spark + Python - Java gateway process exited before sending the driver its port number?
但这个问题一直没有答案。请帮忙!谢谢。
我的iphython笔记本(IPython 3.2.1)在Linux(ubuntu)上也有同样的问题。
我的例子中缺少的是在$PYSPARK_SUBMIT_ARGS环境中设置主URL,如下所示(假设您使用bash):
例如
你可以把它放到你的.bashrc文件中。在spark master的日志中获得正确的URL(使用/sbin/start_master.sh启动master时会报告此日志的位置)。
这应该对你有帮助
一种解决方案是将pyspark shell添加到shell环境变量pyspark_SUBMIT_ARGS:
python/pyspark/java_gateway.py中有一个更改,如果用户设置了pyspark_SUBMIT_ARGS变量,则该更改要求pyspark_SUBMIT_ARGS包含pyspark shell。
一个可能的原因是未设置JAVA_HOME,因为未安装JAVA。
我遇到了同样的问题。上面写着
在
sc = pyspark.SparkConf()
。我通过跑步解决了这个问题来自https://www.digitalocean.com/community/tutorials/how-to-install-java-with-apt-get-on-ubuntu-16-04
相关问题 更多 >
编程相关推荐