将一个数据帧中的一列中的值与另一个数据帧中的多个列进行匹配，并从原始数据帧中创建新列

value name color animal 0 es9bum name1 red dolphin 1 qgl8 name2 cerulean mountaingoat 2 klkwv name3 platinum mantisshrimp 3 tokgs name4 fuchsia tarantula 4 cnwsaq5 name5 frost gentoopenguin

value1 value2 text_bod 0 null tokgs here are some tokgs 1 null null something es9bum 2 klkwv null blahblahblahklkwv 3 null null boop: qgl8. more&& 4 null null hi it me 5 null null here are more words 6 y2kbc null words and stuff 7 null null so much text 8 null null have a nice cnwsaq5 9 null null null

value1 value2 text_bod name color animal 0 null tokgs here are some tokgs name4 fuchsia tarantula 1 null null something es9bum name1 red dolphin 2 klkwv null blahblahblahklkwv name3 platinum mantisshrimp 3 null null boop: qgl8. more&& name2 cerulean mountaingoat 4 null null hi it me NaN NaN NaN 5 null null here are more words NaN NaN NaN 6 y2kbc null words and stuff name99 onyx direwolf 7 null null so much text NaN NaN NaN 8 null null have a nice cnwsaq5 name5 frost gentoopenguin 9 null null null NaN NaN NaN

1条回答

网友

1楼 · 发布于 2024-05-16 12:30:44

我们可以使用^{}在text_bod列中查找单词并提取它们。之后，我们使用这些提取的单词作为key到mergedf1和dfA来获得想要的列。你知道吗

s = ('|').join(dfA['value'])

df1['value'] = df1['text_bod'].str.extract('({})'.format(s))

df1 = df1.merge(dfA, on='value', how='left').drop('value', axis=1)

print(df1)
  value1 value2             text_bod   name     color        animal
0    NaN  tokgs  here are some tokgs  name4   fuchsia     tarantula
1    NaN    NaN     something es9bum  name1       red       dolphin
2  klkwv    NaN    blahblahblahklkwv  name3  platinum  mantisshrimp
3    NaN    NaN   boop: qgl8. more&&  name2  cerulean  mountaingoat
4    NaN    NaN             hi it me    NaN       NaN           NaN

如果您使用的是Python 3.6或更高版本
我们可以在第三行中使用f-strings，这使我们的代码更加简洁：

df1['value'] = df1['text_bod'].str.extract(f'({s})')

相关问题更多 >

编程相关推荐

热门问题

热门文章