我有两个列名为“疗养院”和“设施名称”的数据集。我正在尝试创建一个设施列表,其中设施名称与养老院紧密匹配。比如说
df13.疗养院=[“爱丽丝庄园之家”,“阿莱格尼健康护理与康复中心”]
df21.Facility_Name=[“autum@alice manor”,“Allegany健康护理和康复”]
我有超过20万行的大数据集
我尝试了以下代码,但没有得到预期的结果
matched_facility = []
similarity = []
for i in df13.nursing_home:
match2=process.extract(i, df21.Facility_Name.iloc[0:100],limit=1)
matched_facility.append(match2[0][0])
similarity.append(match2[0][1])
df13['matched_facility'] = pd.Series(matched_facility)
df13['similarity'] = pd.Series(similarity)
df13.head()
我得到了:
但是我想要这样的输出:
护理之家-阿勒格尼健康护理和康复中心
配套设施-Allegany健康护理和康复
目前没有回答
相关问题 更多 >
编程相关推荐