嗨,我有数据框
df_warnings
它从服务器日志中捕获警告,如下所示(显示前3行):
URI code method tid type
date
2017-06-20 URI: /app/faces/pages/oversight/Oversight.jspx ADFC-64001 oracle.adfinternal.controller.state.ControllerState tid: [ACTIVE].ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)' WARNING
2017-06-20 URI: /app/faces/pages/oversight/Oversight.jspx ADFC-64001 oracle.adfinternal.controller.state.ControllerState tid: [ACTIVE].ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)' WARNING
2017-06-20 URI: /app/faces/pages/oversight/Oversight.jspx ADFC-64001 oracle.adfinternal.controller.state.ControllerState tid: [ACTIVE].ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)' WARNING
“code”和“method”列是字符串。我想做的是:
将“method”值按“code”值分组(即,我想查看每个代码的方法和这些方法的计数)
将每个代码组中每个方法的计数按降序分组
按降序排列组(代码)
仅显示每个代码组中的前3个方法和计数
最好的方法是什么?你知道吗
编辑:我试过了
df_warnings['method'].groupby(df_warnings['code']).value_counts()
它给出了按代码装箱的方法和方法计数;但是它没有给出每个代码箱中的前3个方法和方法计数,并且代码箱不是按代码箱中总计数的降序排列的
EDIT2:输出我想要的
code method count
code1 A 100
B 50
C 5
D 2
code2 A 50
B 10
code3 C 50
D 5
在上述代码1中,代码2和代码3按照每个组中的总计数(分别为157、60和55)进行排序,然后在每个组中对方法和计数进行排序
提前谢谢!你知道吗
我想你需要^{} +^{} 来计数,然后^{} :
编辑:
我试着用样本来解释
sort_values
(我认为this回答它解释得更好,尽管它不是熊猫):相关问题 更多 >
编程相关推荐