行内并集行PySpark Datafram

2024-06-12 09:55:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我想将行中包含行的数据帧转换为唯一的行,如下所示:

我的数据帧:

[Row(Autorzc=u'S', Cd=u'00000012793', ClassCli=u'A' Op=Row(CEP=u'04661904', CaracEspecial='S', Venc=Row(v110=u'1', v120=u'2'))),
Row(Autorzc=u'S', Cd=u'00000012794', ClassCli=u'A' Op=Row(CEP=u'04661904', CaracEspecial='S', Venc=Row(v110=u'1', v120=u'2')))]

我想转变成这样:

[Row(Autorzc=u'S', Cd=u'00000012793', ClassCli=u'A', CEP=u'04661904', CaracEspecial='S', v110=u'1', v120=u'2'),
Row(Autorzc=u'S', Cd=u'00000012794', ClassCli=u'A', CEP=u'04661904', CaracEspecial='S', v110=u'1', v120=u'2')]

有什么建议吗?你知道吗


Tags: 数据cd建议rowcepopclasscliv120
1条回答
网友
1楼 · 发布于 2024-06-12 09:55:54

您可以执行一个简单的选择操作,列将相应地重命名。你知道吗

final = initial.select("Autorzc","Cd" , "ClassCli", "Op.CEP"
       "Op.CaracEspecial","Op.Venc.v110","Op.Venc.v120")

print(final.first())

相关问题 更多 >