Windows上的PySpark：配置单元问题

py4j.protocol.Py4JJavaError: An error occurred while calling o337.trainLogisticRegressionModelWithLBFGS. : org.apache.spark.sql.AnalysisException: java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient;

1条回答

网友

1楼 · 发布于 2024-06-07 15:17:30

不需要安装配置单元，但Spark需要与配置单元兼容的类来操作数据帧对象，例如ML管道步骤中的对象。在

例如，pip install pyspark据我所知，这些库（或任何Hadoop）都没有附带。在

如果您从Apache站点下载了Spark with Hadoop，那么您将获得配置单元库和bin/pyspark脚本。不过，在windows上，您可能需要安装WinUtils。在

编程相关推荐

java在Windows 7上配置Apache Ant和Ivy
java使用带有片段的节，NullPointerException
java如何使用Gradle设置环境变量，而不是在Exec范围内？
JavaEclipse（3.5和3.6）在ubuntu中崩溃
java如何通过引导类加载器以编程方式加载另一个类？
java无法使用自定义视图在画布上绘制
java使用Spring引导邮件发送html表
java“\n”在导出到时不工作。jar文件
amazon web services在AWS SDK for Java v2上添加了Gradle依赖项
java在包含ClientBundle的包中有一个成员ClientBundle是一种好的做法吗？

相关问题更多 >

编程相关推荐

热门问题

热门文章