Python数据帧分组条件均值

2024-06-16 14:47:27 发布

您现在位置：Python中文网/ 问答频道 /正文

3989

网友

男 | 程序猿一只，喜欢编程写python代码。

我有一个pandas数据帧，有两列date和{}（3k个不同的日期，总共800k行）

我想计算按日期分组的平均值，但只计算底部十分位的值。在

我尝试过使用DCL = df['date','value'].groupby(['date'])['value'].quantile(.1)，它给了我一个cutoff值，对于每个日期，我如何才能为每个日期创建一个条件平均值，以便它只使用小于DCL（对于每个日期）的值？在

DCL = df['date','value'].groupby(['date'])['value'].quantile(.1)
...
2017-01-26   0.067924
2017-01-27   0.067719
2017-01-30   0.068561
2017-01-31   0.068056
2017-02-01   0.067988
2017-02-02   0.068306
2017-02-03   0.068311
2017-02-06   0.067923
2017-02-07   0.067192
2017-02-08   0.066902
2017-02-09   0.065978
2017-02-10   0.065414
2017-02-13   0.065402
2017-02-14   0.065939
2017-02-15   0.065519

每一天的截止值都是不同的，然后我想计算每天分组的“值”的平均值，只使用该日期低于该天截止值的数字。在

Tags：数据 pandas df date value 数字条件平均值

1条回答

网友

1楼 · 发布于 2024-06-16 14:47:27

考虑使用transform为当前行日期的十分位平均值添加一个新列。在

df['DCL'] = df[['date','value']].groupby(['date'])['value'].\
               transform(lambda g: g[g <= g.quantile(.1)].mean())

Python数据帧分组条件均值

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python数据帧分组条件均值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >