2024-05-23 14:46:04 发布
网友
如何使用WordNet确定python中两个文本之间的语义相似性?
明显的预处理是删除停止词和词干,但是接下来呢?
我唯一能想到的方法是计算两篇文章中每个单词之间的WordNet路径距离。这是unigrams的标准。但这些是大型(400字)文本,是自然语言文档,其中的单词没有任何特定的顺序或结构(英语语法强加的除外)。那么,你会在不同的文本中比较哪些词呢?在python中如何实现这一点?
你可以做的一件事是:
还有别的办法。从每个文档中的句子中计算出句子树。然后比较两片森林。很久以前我也做过类似的工作。Here's the code(记住这是很久以前的事了,是为了上课。所以,至少可以说,代码是非常复杂的。
希望这有帮助
你可以做的一件事是:
还有别的办法。从每个文档中的句子中计算出句子树。然后比较两片森林。很久以前我也做过类似的工作。Here's the code(记住这是很久以前的事了,是为了上课。所以,至少可以说,代码是非常复杂的。
希望这有帮助
相关问题 更多 >
编程相关推荐