我必须用Pyspark中映射表(下面的df2)中的值重命名table()的列。你知道吗
谢谢你的帮助!你知道吗
import pandas as pd
df = pd.DataFrame({'kod':[1,1,3,4,5], 'freq':[4,8,8,20,16], 'lsv':[100,200,300,250,400]})
df2 = pd.DataFrame({'oldid':['kod','freq','lsv'], 'newid':['code','visits','volume']})
mapping=dict(df2[['oldid', 'newid']].values)
df=df.rename(columns=mapping)
display(df2)
我将
freq
的名称更新为zeq
,只是为了演示排序Spark dataframe上有一个名为
toDF
的方法,它将新的头列列表作为参数,并更新dataframe的头。你知道吗如果你需要更多的细节,请告诉我
相关问题 更多 >
编程相关推荐