LCH相似性需要相同的位置?Python

2024-04-27 16:13:15 发布

您现在位置:Python中文网/ 问答频道 /正文

比较wordnet相似性度量,看看哪个与我的语料库最相关/最有用-在计算lch时遇到了这个错误消息-

“计算lch相似性需要Synset('home.n.01)和Synset('chronological.a.01')具有相同的词性。”

在尝试lch之前,是否必须将列表中的所有单词规范化为相同的词性?在

作为参考,我能够成功地计算wup_similarity,而不需要任何POS规范化。我试图计算相似度的单词列表都已经用WordNetLemmatizer进行了柠檬化。在


Tags: 消息home列表度量错误规范化相似性单词
1条回答
网友
1楼 · 发布于 2024-04-27 16:13:15

你不能通过改变词性来解决这个问题,因为不是所有的词都可以是词性的。”例如,按时间顺序排列的“不能是名词。在

一种方法是捕捉这样的异常,或者检查不同的词类,并将相似度指定为零。在

WordNet有时也会通过模拟不同词类的共享词根来处理这一问题,这可能就是某些相似性度量起作用的原因。但是,工作方式is confusing,所以您可能不应该依赖它。在

如果你想让任意单词具有相似性,可以尝试使用单词向量(Word2Vec或GloVe)而不是WordNet。在

相关问题 更多 >