如何在pysparksql中保存表?

2024-04-20 06:45:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我想把我的结果表保存到csv、textfile或类似文件中,以便能够使用RStudio执行可视化。在

我正在使用pyspark.sql在hadoop设置中执行一些查询。我想将结果保存在hadoop中,然后将结果复制到本地驱动器中。在

myTable = sqlContext.sql("SOME QUERIES")
myTable.show() # Show my result
myTable.registerTempTable("myTable") # Save as table
myTable.saveAsTextFile("SEARCH PATH") # Saving result in my hadoop

这将返回:
AttributeError:“DataFrame”对象没有属性“saveAsTextFile”

当我只使用pyspark时,我通常是这样做的pyspark.sql. 在

然后我复制到本地驱动器

^{pr2}$

有人能帮我吗?在


Tags: 文件csvhadoopsqlmy可视化mytablesome