我试图匹配同一数据帧中两列中的名称,如果一列中的名称是另一列的首字母缩略词,即使它们包含相同的首字母缩略词子字符串,我希望创建一个函数来返回True
pd.DataFrame([['Global Workers Company gwc', 'gwc'], ['YTU', 'your team united']] , columns=['Name1','Name2'])
期望输出:
Name1 Name2 Match
0 Global Workers Company gwc gwc True
1 YTU your team united True
我已经创建了一个lambda函数来只获取首字母缩写词,但还不能这样做
t = 'Global Workers Company gwc'
[x[0] for x in t.split()]
['G', 'W', 'C', 'g']
"".join(word[0][0] for word in test1.Name2.str.split()).upper()
您可以使用Dataframe.apply函数和
axis=1
参数在数据帧上应用自定义func
。然后可以使用正则表达式将acronym
与相应的大名或短语进行比较试试这个:
输出:
我将使用地图绘制器。我们将有一个查找字典,它将数据转换为我们可以检查是否相等的相同类型
相关问题 更多 >
编程相关推荐