Python DataFram中Timedelta值的聚合

2024-05-15 13:19:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有大数据帧(df),看起来像:

  Acc_num date_diff
0   29  0:04:43
1   29  0:01:43
2   29  2:22:45
3   29  0:16:21
4   29  0:58:20
5   30  0:00:35
6   34  7:15:26
7   34  4:40:01
8   34  0:56:02
9   34  6:53:44
10  34  1:36:58
.....
Acc_num                    int64
date_diff        timedelta64[ns]
dtype: object

我需要计算每个帐号的“日期差异”平均值(以timedelta格式)。
df.date_diff.mean()工作正常。但当我下一次尝试时:
df.groupby('Acc_num').date_diff.mean()它引发了一个异常:

^{pr2}$

我也试过df.pivot_table()方法,但没有任何效果。在

有人能帮我拿这些东西吗。提前谢谢你!在


Tags: 数据dfdateobjectdiff差异meannum
1条回答
网友
1楼 · 发布于 2024-05-15 13:19:19

真是奇怪的限制。但一个简单的解决方案是:

df.groupby('Acc_num').date_diff.agg(lambda g:g.sum()/g.count())

编辑:
如果传递numeric_only=False,Pandas将实际尝试聚合非数字列

^{pr2}$

相关问题 更多 >