如何在Python中查找列表中字符串之间的相似性

#simple example from fuzzywuzzy import process string = "appl" compare = ["adfad.","apple","asple","tab"] Ratios = process.extract(string,compare) print(Ratios) [('apple', 89), ('asple', 67), ('tab', 29), ('adfad.', 22)] highest = process.extractOne(string,compare) print(highest) ('apple', 89) #data frame from fuzzywuzzy import process dataframecolumn = ["appl","tb"] compare = ["adfad.","apple","asple","tab"] Ratios = process.extract(dataframecolumn,compare) TypeError: expected string or bytes-like object #expected (but I need a list) highest = process.extractOne(dataframecolumn[0],compare) print(highest) ('apple', 89) highest = process.extractOne(dataframecolumn[1],compare) print(highest) ('tab', 80) #Result expected results = ["apple, 89","tab, 80"] #Error myl = ["appl","tb"] compare = ["adfad.","apple","asple","tab"] results = [] for x in myl: results.append(process.extractOne(myl,compare)[1]) TypeError: expected string or bytes-like object

1条回答

网友

1楼 · 发布于 2024-04-20 12:18:39

from operator import itemgetter 

dataframecolumn = ["appl","tb"]
compare = ["adfad.","apple","asple","tab"]
Ratios = [process.extract(x,compare) for x in dataframecolumn]
print ([max(ratios, key = itemgetter(1)) for ratios in Ratios])

# Or oneliner
#Ratios = [max(process.extract(x,compare),key = itemgetter(1)) for x in dataframecolumn]

如果extract总是返回排序结果，那么我们可以避免调用max

^{pr2}$

输出：

[('apple', 89), ('tab', 80)]

如果你想跳过精确的匹配，只得到模糊匹配，那么跳过分数为100%的匹配，并得到第一个非100%匹配，因为它已经排序。在

dataframecolumn = ["apple","tb"]
compare = ["adfad","apple","asple","tab"]
Ratios = [process.extract(x,compare) for x in dataframecolumn]
result = list()
for ratio in Ratios:
    for match in ratio:
        if match[1] != 100:
            result.append(match)
            break
print (result)

相关问题更多 >

编程相关推荐

热门问题

热门文章