基于比较条件将值插入数据帧

2024-05-16 13:48:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图根据与另一个数据帧的比较,将一个值插入到数据帧中。 以下是一个例子:

>>> import pandas as pd
>>> import numpy as np
>>> print(df)
>>> df
      name                          
  0  richard Finn, Tim Maltby       
  1  Fernando Lebrija                          

>>> df2

       Fullname             id
  0   richard Finn          500
  1   Tim Maltby            699
  2   Fernando Lebrija      300

所需输出为:

 >>> df
      name                            id              
  0  richard Finn, Tim Maltby        500,699
  1  Fernando Lebrija                300

我尝试使用:

df['id'] = np.where((df['name']==df2['Fullname']), df2['id]', df['id'])

但它给了我以下错误: `SyntaxError:无效语法


Tags: 数据nameimportidricharddfasnp
3条回答

另一种方法,使用列表理解

mapper = df2.set_index('Fullname')['id'].to_dict()
df['id'] = df['name'].apply(lambda x: ','.join([str(mapper.get(i.strip(), '')) for i in x.split(',')]))



    name                        id
0   richard Finn, Tim Maltby    500,699
1   Fernando Lebrija            300

您可以进行拆分、分解,然后映射和分组:

df['id'] = (df['name'].str.split(',\s*')
    .explode()
    .map(df2.set_index('Fullname')['id'])
    .groupby(level=0).agg(list)
)

输出:

                       name          id
0  richard Finn, Tim Maltby  [500, 699]
1          Fernando Lebrija       [300]

我们还可以探索series.replace

s = dict(df2[['Fullname','id']].astype(str).to_numpy())
df1['id'] = df1['name'].replace(s,regex=True)

print(df1)

                       name        id
0  richard Finn, Tim Maltby  500, 699
1          Fernando Lebrija       300

相关问题 更多 >