使用字典键循环数据帧行，并在匹配时输出值

df=pd.DataFrame({'id':[1,2,3], 'var1':['Apple','Papaya','Banana'], 'var2':['Papaya','Mango','Apple'], 'var3':['Banana','Guava','Grapes'] 'Output_var':['50','50+70','20']})

3条回答

网友

1楼 · 编辑于 2024-05-16 14:27:07

使用replace和生成器表达式（或列表理解），在每列上使用pd.to_numeric。最后，在生成器表达式的输出上调用sum

cols = ['var1', 'var2','var3']
df['output_var'] = sum(pd.to_numeric(col, errors='coerce').fillna(0) 
                                for col in map(df.replace(theDict).get, cols))

In [27]: df
Out[27]:
   id    var1    var2    var3  output_var
0   1   Apple  Papaya  Banana        70.0
1   2  Papaya   Mango   Guava        70.0
2   3  Banana   Apple  Grapes        70.0

网友

2楼 · 编辑于 2024-05-16 14:27:07

首先，我们使用melt将数据解压到行中

然后我们使用Series.map将您的字典映射到水果

最后，我们使用GroupBy.sum和join：

dfm = df.melt('id', ['var1', 'var2', 'var3'])
dfm['Output_var'] = dfm['value'].map(theDict).astype(float)
df = df.set_index('id').join(dfm.groupby('id')['Output_var'].sum()).reset_index()

   id    var1    var2    var3  Output_var
0   1   Apple  Papaya  Banana        70.0
1   2  Papaya   Mango   Guava        70.0
2   3  Banana   Apple  Grapes        70.0

网友

3楼 · 编辑于 2024-05-16 14:27:07

另一种方法是使用apply沿轴映射，它现在接受axis参数

df['vals'] = df.select_dtypes("object").apply(lambda x: x.map(theDict), axis=1).fillna(0).astype(
    int
).sum(axis=1)

   id    var1    var2    var3  vals
0   1   Apple  Papaya  Banana    70
1   2  Papaya   Mango   Guava    70
2   3  Banana   Apple  Grapes    70

如果您只想加入这些值：

df['vals'] = df.select_dtypes("object").apply(lambda x: x.map(theDict), axis=1).stack(0).groupby(
    level=0
).agg("+".join)

print(df)
   id    var1    var2    var3   vals
0   1   Apple  Papaya  Banana  50+20
1   2  Papaya   Mango   Guava     70
2   3  Banana   Apple  Grapes  20+50

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用字典键循环数据帧行，并在匹配时输出值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >