2024-04-26 03:05:23 发布
网友
我有很多文字从网上提取的文本文件。现在我计划构建一个简单的搜索来识别文本文件中的匹配项。例如,如果搜索参数是“3个火枪手”,那么我会寻找所有可能的匹配项,如下面所述
Muskketeers3; three muskteers; 3Muskters; Musketeers3;
我不知道从哪里开始。我可以用python编写一些代码,然后开始研究NLTK及其wordnet。我在这里寻找一些建议,为最好的方法。在
有什么想法吗!在
我确实查看了链接https://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparisonwhich有可用的字符串比较库列表。但复杂的是,如何获得一个词的各种表现形式,如3,3,iii。。。像wordnet。。。感谢你的指导
看看这个模糊的图书馆
https://github.com/seatgeek/fuzzywuzzy
我确实查看了链接https://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparisonwhich有可用的字符串比较库列表。但复杂的是,如何获得一个词的各种表现形式,如3,3,iii。。。像wordnet。。。感谢你的指导
看看这个模糊的图书馆
https://github.com/seatgeek/fuzzywuzzy
相关问题 更多 >
编程相关推荐