计算列表中所有元素与单个元素的相似度

2024-04-26 23:53:43 发布

您现在位置:Python中文网/ 问答频道 /正文

  1. 我需要量化长列表中所有句子的相似度,使之成为一个句子。可能是用Levenshtein或difflib。在
  2. 然后,我必须删除列表中超过某个给定阈值的句子,比如difflib中的90%。在

你们能帮忙吗? 谢谢!在


Tags: 列表阈值句子levenshteindifflib
1条回答
网友
1楼 · 发布于 2024-04-26 23:53:43
>>> mylist = ['ham and eggs', 'spam and legs', "it's time to die, mr bond!"]
>>> import difflib
>>> close_matches = difflib.get_close_matches('spam and eggs', mylist)
>>> close_matches
['spam and legs', 'ham and eggs']
>>> set(mylist) - set(close_matches)
set(["it's time to die, mr bond!"])

相关问题 更多 >