频率和百分比数据帧.groupby带s

1条回答

网友

1楼 · 发布于 2024-05-15 17:10:07

用途：

grs_df_main = pd.DataFrame({'Tenure':[1,1,1,2,2,2,3],
                            'Churn': ['0','1','1','1','0','0','0']})

print(grs_df_main)
   Tenure Churn
0       1     0
1       1     1
2       1     1
3       2     1
4       2     0
5       2     0
6       3     0

如果只需要rate列，可以使用syntactig sugar-groupbyby boolean maskwith Seriesgrs_df_main['Tenure']和aggregate mean：

churn_per_tenure = ((grs_df_main['Churn'] == '1').groupby(grs_df_main['Tenure'])
                                                 .mean()
                                                 .reset_index(name='Churn_Rate'))
print (churn_per_tenure)
   Tenure  Churn_Rate
0       1    0.666667
1       2    0.333333
2       3    0.000000

对于所有列，使用^{}和lambda函数：

f = lambda x: (x == '1').sum()
f.__name__ = 'Churned'
churn_per_tenure = grs_df_main.groupby(['Tenure'])['Churn'].agg([f, 'count']).reset_index()
churn_per_tenure['Churn_Rate'] = churn_per_tenure['Churned'] / churn_per_tenure.pop('count')
print (churn_per_tenure)
   Tenure  Churned  Churn_Rate
0       1        2    0.666667
1       2        1    0.333333
2       3        0    0.000000

如果还需要count列删除pop函数：

churn_per_tenure['Churn_Rate'] = churn_per_tenure['Churned'] / churn_per_tenure['count']
print (churn_per_tenure)
   Tenure  Churned  count  Churn_Rate
0       1        2      3    0.666667
1       2        1      3    0.333333
2       3        0      1    0.000000

相关问题更多 >

编程相关推荐

热门问题

热门文章

频率和百分比数据帧.groupby带s

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >