我有两个数据帧df1
和df2
df1 = pd.DataFrame ({'Name': ['Adam Smith', 'Anne Kim', 'John Weber', 'Ian Ford'],
'Age': [43, 21, 55, 24]})
df2 = pd.DataFrame ({'Name': ['adam Smith', 'Annie Kim', 'John Weber', 'Ian Ford'],
'gender': ['M', 'F', 'M', 'M']})
我需要使用列Name
上的pandas.merge连接这两个数据帧。但是,正如您所注意到的,两个数据帧的Name
列之间有一些细微的差异。让我们假设他们是同一个人。如果我只是这样做:
pd.merge(df1, df2, how='inner', on='Name')
我只得到了一个只有一行的数据帧,那就是‘伊恩·福特’
有人知道如何合并这两个数据帧吗?如果我们在一个字符串列上连接两个表,我想这是非常常见的情况。我完全不知道如何处理这件事。先谢谢你
我在这里使用
fuzzywuzzy
不确定模糊匹配是否是您要寻找的。也许每个名字都是一个合适的名字
相关问题 更多 >
编程相关推荐