我想合并2个数据帧,问题是我使用的键不包含完全相同的值。例如,这就是df1的样子
name val3
Wilder Deontay 1
Fury Tyson 2
Ortiz Luis 3
Joshua Olaseni Oluwafemi Anthony 4
和df2
name1 val
Deontay Wilder 19
Tyson Fury 20
Luis Ortiz 21
Anthony Joshua 10
预期的输出是两个数据帧的合并,因此
name1 val val3
Deontay Wilder 19 1
Tyson Fury 20 2
Luis Ortiz 21 3
Anthony Joshua 10 4
这是我的解决方案
首先我做交叉合并,然后我看相似性。有关
fuzzywuzzy
和token_set_ratio
的详细信息:https://stackoverflow.com/a/31823872/8205554或者你可以用
fuzzymatcher
相关问题 更多 >
编程相关推荐