Pandas groupby+transform和多列

df = pd.DataFrame({'a':[1,2,3,4,5,6], 'b':[1,2,3,4,5,6], 'c':['q', 'q', 'q', 'q', 'w', 'w'], 'd':['z','z','z','o','o','o']}) def f(x): y=sum(x['a'])+sum(x['b']) return(y) df['e'] = df.groupby(['c','d']).transform(f)

2条回答

网友

1楼 · 编辑于 2024-04-24 06:04:35

对于这种特殊情况，您可以：

g = df.groupby(['c', 'd'])

df['e'] = g.a.transform('sum') + g.b.transform('sum')

df
# outputs

   a  b  c  d   e
0  1  1  q  z  12
1  2  2  q  z  12
2  3  3  q  z  12
3  4  4  q  o   8
4  5  5  w  o  22
5  6  6  w  o  22

如果您可以在同一groupby上通过独立变换的线性组合来构造最终结果，那么这个方法就可以工作了。在

否则，您将使用groupby-apply，然后合并回原始df。在

示例：

^{pr2}$

网友

2楼 · 编辑于 2024-04-24 06:04:35

您可以将GroupBy+transform与sum一起使用两次：

df['e'] = df.groupby(['c', 'd'])[['a', 'b']].transform('sum').sum(1)

print(df)

   a  b  c  d   e
0  1  1  q  z  12
1  2  2  q  z  12
2  3  3  q  z  12
3  4  4  q  o   8
4  5  5  w  o  22
5  6  6  w  o  22

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas groupby+transform和多列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >