我有一个类似于这个的数据框
GRP HOST1 HOST2 HOST3 FILESIZE
0 0 srv39 srv45 srv47 203498176
1 1 srv102 srv36 srv38 452763956
2 1 srv101 srv36 srv45 453277268
3 1 srv101 srv34 srv45 448174741
4 1 srv36 srv49 srv50 452728577
5 2 srv100 srv47 srv48 454617541
6 2 srv100 srv45 srv49 454617541
7 2 srv38 srv49 srv47 454617541
现在,我要实现的是统计我在host1host2和HOST3列中的所有事件,这些事件按GRP列分组,如下所示
--
GRP HOST count
1 srv101 2
srv36 3
如果我能够对FILESIZE列的值求和,那就太好了。
我试图使用我找到的here的建议来形成一个解决方案,但是我无法得到按GRP分组的计数。你知道吗
有没有关于哪种方法是获得我对熊猫所需结果的最佳方法的建议?你知道吗
使用^{} 重塑anf,然后聚合^{} :
如果需要列} :
FILESIZE
的sum
,请使用^{您可以使用
stack
,然后使用groupby
和size
如果你需要总和
相关问题 更多 >
编程相关推荐