PySpark：Python字典中所有数据帧的联合

1条回答

网友

1楼 · 发布于 2024-04-18 04:37:08

参考了给定的here的解决方案，感谢@pault。在

from functools import reduce
from pyspark.sql import DataFrame

def union_all(*dfs):
    return reduce(DataFrame.union, dfs)

df1 = sqlContext.createDataFrame([(1, "foo1"), (2, "bar1")], ("k", "v"))
df2 = sqlContext.createDataFrame([(3, "foo2"), (4, "bar2")], ("k", "v"))
df3 = sqlContext.createDataFrame([(5, "foo3"), (6, "bar3")], ("k", "v"))

my_dic = {}
my_dic["df1"] = df1
my_dic["df2"] = df2
my_dic["df3"] = df3

new_df = union_all(*my_dic.values())

print(type(new_df))   # <class 'pyspark.sql.dataframe.DataFrame'>
print(new_df.show())  

"""
+ -+  +
|  k|   v|
+ -+  +
|  1|foo1|
|  2|bar1|
|  3|foo2|
|  4|bar2|
|  5|foo3|
|  6|bar3|
+ -+  +
"""

编辑：使用DataFrame.union而不是{}，因为后者已被弃用。在

编程相关推荐

javajsoup:select（div[class=rslt prod]）在不应该返回null时返回null
java如何使用selenium下载POST响应文件
Java代码在逐步调试模式下运行良好，而不是在默认运行模式下
postgresql如何检查所选区域的lat/lon是否在使用Java的数据库中定义的范围内
java在web服务中是否有类似侦听器的功能？
java如何使用Hibernate条件实现这个多重选择和where查询？
swing使用java创建图像文件
java将一个类连接到主类
java将EditText更改为TextView
Java/Kotlin在for循环中为步骤+1和if条件之前的步骤获取值

相关问题更多 >

编程相关推荐

热门问题

热门文章

PySpark：Python字典中所有数据帧的联合

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >