在python中使用Fuzz进行通配符匹配

2024-06-08 10:03:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个列名为“疗养院”和“设施名称”的数据集。我正在尝试创建一个设施列表,其中设施名称与养老院紧密匹配。比如说

df13.疗养院=[“爱丽丝庄园之家”,“阿莱格尼健康护理与康复中心”]
df21.Facility_Name=[“autum@alice manor”,“Allegany健康护理和康复”]

我有超过20万行的大数据集

我尝试了以下代码,但没有得到预期的结果

matched_facility = []
similarity = []
for i in df13.nursing_home:
match2=process.extract(i, df21.Facility_Name.iloc[0:100],limit=1)
matched_facility.append(match2[0][0])
similarity.append(match2[0][1])
df13['matched_facility'] = pd.Series(matched_facility)
df13['similarity'] = pd.Series(similarity)

df13.head()

我得到了:

My Output

但是我想要这样的输出:

护理之家-阿勒格尼健康护理和康复中心
配套设施-Allegany健康护理和康复


Tags: 数据name名称护理设施appendfacilitysimilarity