2024-04-26 21:42:25 发布
网友
将数据帧写入HDFS(Spark 1.6)。
df.write.save('/target/path/', format='parquet', mode='append') ## df is an existing DataFrame object.
一些格式选项是csv、parquet、json等
csv
parquet
json
从HDFS读取数据帧(Spark 1.6)。
from pyspark.sql import SQLContext sqlContext = SQLContext(sc) sqlContext.read.format('parquet').load('/path/to/file')
format方法接受诸如parquet、csv、json等参数
将数据帧写入HDFS(Spark 1.6)。
一些格式选项是
csv
、parquet
、json
等从HDFS读取数据帧(Spark 1.6)。
format方法接受诸如
parquet
、csv
、json
等参数相关问题 更多 >
编程相关推荐