'熊猫在多个分组等级内的排名'

1条回答

网友

1楼 · 发布于 2024-04-26 14:14:01

更新答案

我将分为多个步骤（请注意，为了清晰起见，我更改了您的列名，即df.columns=['Col1','Col2','Col3']）：

   Col1  Col2  Col3
0    a   car     6
1    a  bike     7
2    a   car     8
3    b  bike     9
4    b   car    10
5    b  bike    11

第1步

我们首先希望groupby('Col1')并使用transform(sum)根据与给定组相关联的Col3中的值的和来转换数据帧。这通过使用sort_values('Col3', ascending=False)存储结果索引并使用它来设置原始数据帧df的索引，来设置Col1的顺序。在

^{pr2}$

它给出了：

   Col1  Col2  Col3
3    b  bike     9
4    b   car    10
5    b  bike    11
0    a   car     6
1    a  bike     7
2    a   car     8

第2步

现在我们可以简单地按Col1和Col2分组，使用sort=False来保持步骤1中的排序顺序，并基于Col3的和进行聚合。使用reset_index()清理索引并还原原始列。在

step2 = step1.groupby(['Col1','Col2'], sort=False).agg({'Col3': 'sum'}).reset_index()

您想要的输出：

   Col1  Col2  Col3
0    b  bike    20
1    b   car    10
2    a   car    14
3    a  bike     7

相关问题更多 >

编程相关推荐

热门问题

热门文章

'熊猫在多个分组等级内的排名'

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >