词移动距离与余弦相似度的关系

2024-03-28 15:19:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道哪种算法是语义相似度最好的?有人能解释为什么吗?你知道吗

谢谢你!你知道吗


Tags: 算法语义
1条回答
网友
1楼 · 发布于 2024-03-28 15:19:04

什么-词,短语,句子,段落,文档,其他的语义相似性?关于什么样的最终目标是“最好的”?你知道吗

最初定义“词移动距离”的论文“From Word Embeddings To Document Distances”,给出了一些大规模杀伤性武器在哪里运作良好的例子,并将其行为与其他相似性计算进行了比较。你知道吗

但是,大规模杀伤性武器的计算成本要高得多,尤其是在较长的文本上。而且,作为一种使用每个词的存在的方法,不管顺序如何,当微小的语法变化(比如在正确的位置加上“not”)可能会完全颠倒文本对人类读者的意义时,这种方法仍然不够强大。(但话说回来,快速而简单的比较,比如两个词包表示之间的余弦相似性,或者两个词向量平均表示之间的余弦相似性,在那里也不强。)

相关问题 更多 >