Python-Pandas：Groupby和Apply多列操作

df1= pd.DataFrame({ 'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'], 'C' : np.random.randn(8), 'D' : np.random.randn(8)}) A B C D 0 foo one 1.652675 -1.983378 1 bar one 0.926656 -0.598756 2 foo two 0.131381 0.604803 3 bar three -0.436376 -1.186363 4 foo two 0.487161 -0.650876 5 bar two 0.358007 0.249967 6 foo one -1.150428 2.275528 7 foo three 0.202677 -1.408699 def fun1(gg): # this does not work return pd.DataFrame({'AA':C.mean()+gg.C.std(), 'BB':gg.C.std()}) dg1 = df1.groupby('A') df2 = dg1.apply(fun1)

1条回答

网友

1楼 · 发布于 2024-05-14 09:31:09

你的f函数有没有打字错误？AA应该是C.mean() + C.std()还是{}

在第一种情况下，AA=C.mean() + C.std()

In [91]: df = df1.groupby('A').agg({'C': lambda x: x.mean() + x.std(),
                                    'D': lambda x  x.std()})

In [92]: df
Out[92]: 
            C         D
A                      
bar  1.255506  0.588981
foo  1.775945  0.442724

对于第二个问题C.mean() + D.mean()，情况并没有那么好。当您给groupby对象上的.agg函数一个dict时，我认为没有办法从两列中获取值。在

^{pr2}$

您可能需要将g.mean（）和g.std（）分配给临时变量，以避免计算它们两次。在

相关问题更多 >

编程相关推荐

热门问题

热门文章