2024-04-27 16:13:15 发布
网友
比较wordnet相似性度量,看看哪个与我的语料库最相关/最有用-在计算lch时遇到了这个错误消息-
“计算lch相似性需要Synset('home.n.01)和Synset('chronological.a.01')具有相同的词性。”
在尝试lch之前,是否必须将列表中的所有单词规范化为相同的词性?在
作为参考,我能够成功地计算wup_similarity,而不需要任何POS规范化。我试图计算相似度的单词列表都已经用WordNetLemmatizer进行了柠檬化。在
你不能通过改变词性来解决这个问题,因为不是所有的词都可以是词性的。”例如,按时间顺序排列的“不能是名词。在
一种方法是捕捉这样的异常,或者检查不同的词类,并将相似度指定为零。在
WordNet有时也会通过模拟不同词类的共享词根来处理这一问题,这可能就是某些相似性度量起作用的原因。但是,工作方式is confusing,所以您可能不应该依赖它。在
如果你想让任意单词具有相似性,可以尝试使用单词向量(Word2Vec或GloVe)而不是WordNet。在
你不能通过改变词性来解决这个问题,因为不是所有的词都可以是词性的。”例如,按时间顺序排列的“不能是名词。在
一种方法是捕捉这样的异常,或者检查不同的词类,并将相似度指定为零。在
WordNet有时也会通过模拟不同词类的共享词根来处理这一问题,这可能就是某些相似性度量起作用的原因。但是,工作方式is confusing,所以您可能不应该依赖它。在
如果你想让任意单词具有相似性,可以尝试使用单词向量(Word2Vec或GloVe)而不是WordNet。在
相关问题 更多 >
编程相关推荐