将Difflib SequenceMatcher与TfIDF(TfidfVectorizer)一起使用

2024-04-19 02:49:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我对Python还不熟悉,所以请原谅我的天真。我研究了很多在Python中使用余弦相似度来计算字符串相似度的例子。不过,我想使用Difflib的SequenceMatcher。有没有办法用TfidfVectorizer和Difflib的SequenceMatcher来计算相似度得分?你知道吗

我有一个数据库,里面有超过6000条评论和建议。我的目标是匹配所有现有的建议,并选择最好的5至10个建议,最符合新的提交。我正在使用来自sklearn.feature_extraction.textTfidfVectorizer


Tags: 字符串text数据库目标评论sklearn建议feature