使用数据帧合并（连接）4个具有不同ID和多个值的不同CSV文件

Name | Address | ID_1 | ID_2 | ID_3 Ruth D. Batie | 4962 Hill Street | 1_001 | NaN | 3_004 Kelley C. Rice | 1074 Tipple Road | NaN | 2_002 | NaN Gary P. Kirby | 1520 Robinson Court | 1_004 | 2_002;2_004 | 3_004

result = pd.merge(df_main, df_1[['ID_1', 'Monthly_MB']], df_2[['ID_2', 'platform']], df_3[['ID_3', 'Device']], on=' ??') result.head()

2条回答

网友

1楼 · 编辑于 2024-05-13 07:08:40

您可以使用下面的代码来匹配/替换这些值。添加用于检测具有多个值的单元格的if语句，并用分号拆分这些值：

for i in df_main['ID_1']:
    df_main.loc[df_main['ID_1']==i , 'ID_1'] = df_1.loc[df_1['ID_1']==i , 'Monthly_MB']

网友

2楼 · 编辑于 2024-05-13 07:08:40

我建议首先使用^{}和^{}创建包含所有查找文件的字典：

d = {'ID_1' : df2.set_index('ID_1')['Monthly_MB'].to_dict(),
     'ID_2' : df3.set_index('ID_2')['platform'].to_dict(),
     'ID_3' : df4.set_index('ID_3')['Device'].to_dict()}

然后按字典的所有键循环并使用列表理解-首先按;拆分值如果是字符串，则按字典映射，然后按join返回;：

for c in d.keys():
    f = lambda x: ';'.join(str(d[c].get(y, '')) for y in x.split(';')) 
                                                if isinstance(x, str) 
                                                else x
    df1[c] = df1[c].apply(f)

print (df1)
             Name              Address  ID_1         ID_2    ID_3
0  Ruth D. Batie   4962 Hill Street     1557  NaN          BOOST2
1  Kelley C. Rice  1074 Tipple Road     NaN   android      NaN   
2  Gary P. Kirby   1520 Robinson Court  24    android;ios  BOOST2

相关问题更多 >

编程相关推荐

热门问题

热门文章