合并时不复制列

postcode lat_x lon_x lat_y lat_x ...plus 32 more columns M20 2.3 0.2 NaN NaN LS1 NaN NaN 1.4 0.1 LS1 NaN NaN 1.4 0.1 LS2 NaN NaN 1.5 0.2 M21 2.4 0.3 NaN NaN

2条回答

网友
1楼 · 编辑于 2024-04-19 09:50:03

DataFrame.combine_first(self, other)似乎是最好的解决方案。你知道吗
如果只需要一行代码而不想更改输入数据帧：
df1.set_index('postcode').combine_first(df2.set_index('postcode'))
如果需要保留df1的索引：
df1.reset_index().set_index('postcode').combine_first(df2.set_index('postcode')).reset_index().set_index('index').sort_index()
不是为了优雅，而是为了工作。你知道吗

网友
2楼 · 编辑于 2024-04-19 09:50:03

在两个数据帧中使用^{}和postcode索引，然后在必要时为相同顺序的列添加^{}，如原始df1：
print (df1) postcode lat lon plus 32 more columns 0 M20 2.3 0.2 NaN NaN NaN NaN 1 LS1 NaN NaN NaN NaN NaN NaN 2 LS1 NaN NaN NaN NaN NaN NaN 3 LS2 NaN NaN NaN NaN NaN NaN 4 M21 2.4 0.3 NaN NaN NaN NaN df1 = df1.set_index('postcode') df2 = df2.set_index('postcode') df3 = df1.combine_first(df2).reindex(df1.columns, axis=1) print (df3) lat lon plus 32 more columns postcode LS1 1.4 0.1 NaN NaN NaN NaN LS1 1.4 0.1 NaN NaN NaN NaN LS2 1.5 0.2 NaN NaN NaN NaN M20 2.3 0.2 NaN NaN NaN NaN M21 2.4 0.3 NaN NaN NaN NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章