基于相似性替换字符串

from difflib import SequenceMatcher from pprint import pprint def similar(a, b): return SequenceMatcher(None, a, b).ratio() strlist = ['D-astroid 3-cyclone', 'DL-astroid 3-cyclone', 'DL-astroid', 'D-comment'] to_match = ['astroid 3-cyclone', 'D-comment', 'D-astroid'] similarity = similar('DL-astroid', 'astroid 3-cyclone') pprint(similarity)

from difflib import SequenceMatcher from pprint import pprint def similar(a, to_match): percent_similarity = [SequenceMatcher(None, a, b).ratio() for b in to_match] max_value_index = [i for i, j in enumerate(percent_similarity) if j == max(percent_similarity)][0] map = [to_match[max_value_index] if max(percent_similarity) > 0.9 else a][0] return map strlist = ['D-saturn 6-pluto', 'D-astroid 3-cyclone', 'DL-astroid 3-cyclone', 'DL-astroid', 'D-comment', 'literal'] to_match = ['saturn 6-pluto', 'pluto', 'astroid 3-cyclone', 'D-comment', 'D-astroid'] map = [similar(item, to_match) for item in strlist] pprint(map)

1条回答

网友

1楼 · 发布于 2024-05-26 14:21:23

您可以从第二个列表创建字典并将其应用于第一个列表：

strlist = ['D-astroid 3-cyclone', 'DL-astroid 3-cyclone', 'DL-astroid', 'D-comment', 'satellite']
to_match = ['astroid 3-cyclone', 'D-comment', 'D-astroid']
d1 = {i.split('-')[-1]:i for i in to_match}
result1 = [d1.get(i.split('-')[-1], i) for i in strlist]
result2 = {b:[i for i in strlist if i.endswith(a)] for a, b in d1.items()}
result2 = {a:b if len(b) != 1 else b[0] for a, b in result2.items()}

输出：

['astroid 3-cyclone', 'astroid 3-cyclone', 'D-astroid', 'D-comment', 'satellite']
{'astroid 3-cyclone': ['D-astroid 3-cyclone', 'DL-astroid 3-cyclone'], 'D-comment': 'D-comment', 'D-astroid': 'DL-astroid'}

相关问题更多 >

编程相关推荐

热门问题

热门文章