如何在pysparksql中保存表？

2024-04-20 06:45:37 发布

您现在位置：Python中文网/ 问答频道 /正文

5569

网友

男 | 程序猿一只，喜欢编程写python代码。

我想把我的结果表保存到csv、textfile或类似文件中，以便能够使用RStudio执行可视化。在

我正在使用pyspark.sql在hadoop设置中执行一些查询。我想将结果保存在hadoop中，然后将结果复制到本地驱动器中。在

myTable = sqlContext.sql("SOME QUERIES")
myTable.show() # Show my result
myTable.registerTempTable("myTable") # Save as table
myTable.saveAsTextFile("SEARCH PATH") # Saving result in my hadoop

这将返回：
AttributeError:“DataFrame”对象没有属性“saveAsTextFile”

当我只使用pyspark时，我通常是这样做的pyspark.sql. 在

然后我复制到本地驱动器

^{pr2}$

有人能帮我吗？在

Tags：文件 csv hadoop sql my 可视化 mytable some

1条回答

网友

1楼 · 发布于 2024-04-20 06:45:37

您可以将DataFrameWriter与支持的格式之一一起使用。例如JSON：

myTable.write.json(path)

如何在pysparksql中保存表？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在pysparksql中保存表？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >