我正在开发一个字符串比较工具。我有两组json数据,如下所示。在
数据框1:
ID Subject
1 Angular JS : getting unexpected cross symbol with Image
2 Cordova debug: the specified file was not found
3 get custom mask for phone numbers
4 Remove files for the Xcode Bots Unit Test Coverage
5 "Upload to Mongodb collection in aldeed:autoform
6 Mask for phone numbers
数据框2:
^{pr2}$现在,对于python+pandas,对于表2中的每个ID,我想在表1的行中找到一个匹配紧密的条目,单词序列无关紧要,需要从比较中消除特殊字符。在
例如:
For ID 1 - ID 2 has 5 matching words
For ID 1 - ID 6 has 4 matching words
For ID 2 - ID 4 has 8 matching words
For ID 3 - ID 4 has 4 matching words
有什么建议吗?在
我认为您可以将前面的solution和{a2}与^{} ,^{} 通过{}和{cd4>}与aggegating ^{} 相结合:
其他可能的解决方案是使用:
^{pr2}$相关问题 更多 >
编程相关推荐