Windows上的PySpark:配置单元问题

2024-06-07 15:17:30 发布

您现在位置:Python中文网/ 问答频道 /正文

有许多问题要从后勤数据库运行:

py4j.protocol.Py4JJavaError: An error occurred while calling o337.trainLogisticRegressionModelWithLBFGS.
: org.apache.spark.sql.AnalysisException: java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient;

事实上我甚至没有安装蜂箱。。。但是为什么这个功能依赖于蜂巢呢?文件里没有写。。。安装配置单元以运行任何Mllib函数是先决条件吗?在


Tags: organ数据库langapacheerrorjavaprotocol
1条回答
网友
1楼 · 发布于 2024-06-07 15:17:30

不需要安装配置单元,但Spark需要与配置单元兼容的类来操作数据帧对象,例如ML管道步骤中的对象。在

例如,pip install pyspark据我所知,这些库(或任何Hadoop)都没有附带。在

如果您从Apache站点下载了Spark with Hadoop,那么您将获得配置单元库和bin/pyspark脚本。不过,在windows上,您可能需要安装WinUtils。在

相关问题 更多 >

    热门问题