单词/句子相似性。最好的方法是什么?

2024-06-17 11:56:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要为产品主数据目的构建一个算法,我不确定这方面的最佳NLP方法。情况是: -我有产品的黄金记录; -我有许多其他产品目录需要协调; 例子: -产品金纪录:焦炭和零焦; -需要熏蒸的产品说明:焦炭300ml,焦炭零300ml,Cke零。你知道吗

我需要一个通过相似性来协调的算法,因为我必须考虑拼写错误,有时还要考虑句子中的一个产品片段。示例:Coke zero JS MKT(JS和MKT是垃圾,但这个句子更类似于Coke zero)。你知道吗

我一直在测试一些NLP的句子相似性,比如Bag of words,也在阅读一些其他的方法,比如Cosine相似性和Levenshtein距离。然而,我不知道什么是我的情况下最好的选择。你知道吗

你能帮我理解实现我所需要的最好方法吗?你知道吗


Tags: 数据方法目的算法nlp产品js情况