寻找多层次平均值

2条回答

网友

1楼 · 编辑于 2024-04-27 16:16:28

解决方案

你可以用

df.groupby(['Cohort', 'User']).describe()

或者

df.groupby(['Cohort']).describe()

根据您的期望输出

df.groupby(['Cohort'])['User'].apply(lambda x: x.describe().ix['unique'])

以及

df.groupby(['Cohort', 'User'])['Comment'].apply(lambda x: x.describe().ix['unique'])

以及

df.groupby(['Cohort'])['Comment'].apply(lambda x: x.describe().ix['unique'])

网友

2楼 · 编辑于 2024-04-27 16:16:28

>>> df.groupby('Cohort').User.apply(lambda group: group.unique())
Cohort
a    [alex, beth, craig]
b          [beth, craig]
Name: User, dtype: object

>>> df.groupby('Cohort').User.apply(lambda group: group.nunique())
Out[40]: 
Cohort
a    3
b    2
Name: User, dtype: int64

>>> df.groupby(['Cohort', 'User']).Comment.count()
Out[43]: 
Cohort  User 
a       alex     2
        beth     1
        craig    2
b       beth     3
        craig    3
Name: Comment, dtype: int64

df.groupby(['Cohort']).Comment.count()
Out[44]: 
Cohort
a    5
b    6
Name: Comment, dtype: int64

解决方案

根据您的期望输出

相关问题更多 >

编程相关推荐

热门问题

热门文章

寻找多层次平均值

解决方案

根据您的期望输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >