根据部分匹配组合两个Pandasdf

Sched = pd.DataFrame({ 'E' : ['Home','Shops','Away','Shops','Home'], 'F' : ['10:00:00','11:00:00','12:00:00','13:00:00','14:00:00'], 'G' : ['No: 10', 'No: 2', 'No: 1','No: 3','No: 11'], })

Code = pd.DataFrame({ 'H' : ['HOME LOCK','AWAY HR','SHOPS JK'], 'I' : ['Home','Away','Shops'], }) Meet['B'] = Meet['B'].map(Code.set_index('H')['I'])

1条回答

网友

1楼 · 发布于 2024-04-19 14:35:56

我相信如果第一个单词匹配，^{}可以与^{}连用：

Meet['E'] = Meet.B.str.title().str.split().str[0]
print (Meet)
          A          B    C   D      E
0  10:00:05  HOME LOCK  No:  10   Home
1  11:00:05    AWAY HR  No:   1   Away
2  12:00:05   SHOPS JK  No:   2  Shops
3  13:00:05  HOME LOCK  No:  11   Home
4  14:00:05   SHOPS JK  No:   3  Shops

另一个更一般的解决方案是使用^{}，用|来连接regex或：

^{pr2}$

如果使用Sched的E列的唯一值创建模式，并且\b作为单词边界，那么什么应该更动态：

pat = '|'.join(r"\b{}\b".format(x) for x in Sched.E.unique())
print (pat)
\bHome\b|\bShops\b|\bAway\b

Meet['E'] = Meet.B.str.title().str.extract('(' + pat + ')')
print (Meet)
          A          B    C   D      E
0  10:00:05  HOME LOCK  No:  10   Home
1  11:00:05    AWAY HR  No:   1   Away
2  12:00:05   SHOPS JK  No:   2  Shops
3  13:00:05  HOME LOCK  No:  11   Home
4  14:00:05   SHOPS JK  No:   3  Shops

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据部分匹配组合两个Pandasdf

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >