有没有什么方法可以在熊猫中使用fuzzyfuzzy来加速模糊字符串匹配。在
我有一个名为extra_names
的数据帧,它的名称我想与另一个数据帧names_df
运行模糊匹配。在
>> extra_names.head()
not_matching
0 Vij Sales
1 Crom Electronics
2 REL Digital
3 Bajaj Elec
4 Reliance Digi
>> len(extra_names)
6500
>> names_df.head()
names types
0 Vijay Sales 1
1 Croma Electronics 1
2 Reliance Digital 2
3 Bajaj Electronics 2
4 Pai Electricals 2
>> len(names_df)
250
到目前为止,我正在使用下面的代码运行逻辑,但是要花很长时间才能完成。在
^{pr2}$当我发布这个问题时,查询仍在运行。有什么方法可以加快这个模糊字符串匹配的过程吗?在
让我们试试
difflib
:相关问题 更多 >
编程相关推荐