Pandas计算各组间唯一数字的平均数

2条回答

网友

1楼 · 编辑于 2024-06-17 11:00:54

IIUC，首先要对每个age和household进行聚合：

agg = (df.groupby(['age_group', 'household_key'])
         .agg({'DAY': 'nunique'})
      )

然后再用groupby表示平均值，例如

agg.groupby('age_group').mean()

将给出household_key中每个age_group的平均值

网友

2楼 · 编辑于 2024-06-17 11:00:54

如果我正确理解你想要达到的目标，你可以尝试以下方法：

import pandas as pd
data = {'household_key':[1,1,1,1,2,2,2,3,3,3],
        'age_group':[25,25,25,25,30,30,30,25,25,25],
        'income_group':[40,40,40,40,40,40,40,30,30,30],
        'day':['2019-01-01','2019-01-05','2019-01-08','2019-01-15','2019-01-01','2019-01-08','2019-01-10','2019-01-01','2019-01-05','2019-01-10']}

df = pd.DataFrame(data)
# get group by household
group1 = df.groupby(['household_key', 'age_group']).agg({'day': 'nunique'})
# get group by age_group
group2 = df.groupby(['age_group']).agg({'day': 'nunique'})
# join the results
group = group2.merge(group1, how='right', left_index=True, right_index=True)
group.columns = ['unique_days_in_group', 'unique_days_in_household']
print(group)

结果如下：

                         unique_days_in_group  unique_days_in_household
household_key age_group                                                
1             25                            5                         4
2             30                            3                         3
3             25                            5                         3

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas计算各组间唯一数字的平均数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >