如何找到拆分数组的其他值的组平均值?

2024-05-15 21:36:17 发布

您现在位置:Python中文网/ 问答频道 /正文

到目前为止,我已经将我的数据分为10个相等的、分类的分层收入组。在消耗数据集中,有“月收入”和“工作满意度”两列(1-4整数)。我已经找到了每个群体的平均收入,现在想找到这些群体的平均工作满意度进行比较。有什么方法可以做到这一点

sorted_income= attrition['MonthlyIncome'].sort_values()
income_by_level= np.array_split(sorted_income, 10)
mean_income_by_level= list(map(lambda x: np.mean(x), income_by_level))` 
mean_income_by_level

输出

[1991.9591836734694,
 2489.6326530612246,
 2940.5646258503402,
 3794.904761904762,
 4562.102040816327,
 5317.476190476191,
 6337.340136054422,
 8373.925170068027,
 11521.979591836734,
 17699.428571428572]`

我很想看到每个相应的工作满意度的含义


Tags: 数据方法by分层np分类整数mean
1条回答
网友
1楼 · 发布于 2024-05-15 21:36:17

假设您有一个已排序的数据帧

如果没有组列,则可以执行以下操作来生成它(在执行此操作之前对帧进行排序以避免混淆组,这一点很重要):

df['group'] = (df.index / (df.shape[0]/10.)).astype(int)

然后执行groupby

df.groupby('group').agg({'income':np.mean,'satisfaction':np.mean, 'abc':np.mean })

相关问题 更多 >