识别单词的不同形式(搜索相似的单词)

2024-04-26 03:05:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我有很多文字从网上提取的文本文件。现在我计划构建一个简单的搜索来识别文本文件中的匹配项。例如,如果搜索参数是“3个火枪手”,那么我会寻找所有可能的匹配项,如下面所述

Muskketeers3;   
three muskteers;
3Muskters;
Musketeers3;

我不知道从哪里开始。我可以用python编写一些代码,然后开始研究NLTK及其wordnet。我在这里寻找一些建议,为最好的方法。在

有什么想法吗!在


Tags: 方法代码参数建议wordnet计划three文字