Python数据帧分组条件均值

2024-06-16 14:47:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pandas数据帧,有两列date和{}(3k个不同的日期,总共800k行)

我想计算按日期分组的平均值,但只计算底部十分位的值。在

我尝试过使用DCL = df['date','value'].groupby(['date'])['value'].quantile(.1),它给了我一个cutoff值,对于每个日期,我如何才能为每个日期创建一个条件平均值,以便它只使用小于DCL(对于每个日期)的值?在

DCL = df['date','value'].groupby(['date'])['value'].quantile(.1)
...
2017-01-26   0.067924
2017-01-27   0.067719
2017-01-30   0.068561
2017-01-31   0.068056
2017-02-01   0.067988
2017-02-02   0.068306
2017-02-03   0.068311
2017-02-06   0.067923
2017-02-07   0.067192
2017-02-08   0.066902
2017-02-09   0.065978
2017-02-10   0.065414
2017-02-13   0.065402
2017-02-14   0.065939
2017-02-15   0.065519

每一天的截止值都是不同的,然后我想计算每天分组的“值”的平均值,只使用该日期低于该天截止值的数字。在


Tags: 数据pandasdfdatevalue数字条件平均值