如何使用sparkcassandraconnector连接spark和cassandra？

2条回答

网友

1楼 · 编辑于 2024-05-28 23:30:20

我在一个独立的python脚本中使用了pyspark。我不使用DSE，我从datatax的github存储库克隆了cassandraspark connector，并用datataxinstrucctions编译。在

为了访问spark中的spark连接器，我复制到spark安装中的jars文件夹。在

我认为这对你也有好处：

 cp ~/spark-cassandra-connector/spark-cassandra-connector/target/full/scala-2.11/spark-cassandra-connector-assembly-2.0.5-86-ge36c048.jar $SPARK_HOME/jars/

您可以访问this，在那里我解释我自己设置环境的经验。在

一旦spark可以访问Cassandra连接器，就可以使用pyspark库作为包装：

^{pr2}$

在这个example中，您可以看到整个脚本。在

网友

2楼 · 编辑于 2024-05-28 23:30:20

下面是如何将spark shell连接到非dse版本中的cassandra。在

将spark-cassandra-connectorjar复制到spark/spark-hadoop-directory/jars/

spark-shell  jars ~/spark/spark-hadoop-directory/jars/spark-cassandra-connector-*.jar

在sparkshell中执行以下命令

^{pr2}$

如果您的cassandra有密码设置等，则必须提供更多参数：）

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用sparkcassandraconnector连接spark和cassandra？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >