Pandas Groupby和Sum只有一列

2024-05-16 06:00:51 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一个数据帧,df1,它看起来如下所示:

       A      B      C
1     foo    12    California
2     foo    22    California
3     bar    8     Rhode Island
4     bar    32    Rhode Island
5     baz    15    Ohio
6     baz    26    Ohio

我想按A列分组,然后对B列求和,同时将值保留在C列中。如下所示:

      A       B      C
1    foo     34    California
2    bar     40    Rhode Island
3    baz     41    Ohio

问题是,当我说df.groupby('A').sum()列C被删除时,返回

      B
A
bar  40
baz  41
foo  34

当我分组和求和时,我怎样才能绕过这个并保留C列呢?


Tags: 数据dffoobarbazdf1sumgroupby
2条回答

唯一的方法是在groupby中包含C(groupby函数可以接受列表)。

试试看:

df.groupby(['A','C'])['B'].sum()

还有一点要注意,如果在聚合之后需要使用df,还可以使用as_index=False选项返回dataframe对象。当我第一次和熊猫一起工作时,这个给了我很多问题。示例:

df.groupby(['A','C'], as_index=False)['B'].sum()

如果您不关心C列中的内容,只需要nth值,您可以这样做:

df.groupby('A').agg({'B' : 'sum',
                     'C' : lambda x: x.iloc[n]})

相关问题 更多 >