到目前为止,我已经将我的数据分为10个相等的、分类的分层收入组。在消耗数据集中,有“月收入”和“工作满意度”两列(1-4整数)。我已经找到了每个群体的平均收入,现在想找到这些群体的平均工作满意度进行比较。有什么方法可以做到这一点
sorted_income= attrition['MonthlyIncome'].sort_values()
income_by_level= np.array_split(sorted_income, 10)
mean_income_by_level= list(map(lambda x: np.mean(x), income_by_level))`
mean_income_by_level
输出
[1991.9591836734694,
2489.6326530612246,
2940.5646258503402,
3794.904761904762,
4562.102040816327,
5317.476190476191,
6337.340136054422,
8373.925170068027,
11521.979591836734,
17699.428571428572]`
我很想看到每个相应的工作满意度的含义
假设您有一个已排序的数据帧
如果没有组列,则可以执行以下操作来生成它(在执行此操作之前对帧进行排序以避免混淆组,这一点很重要):
然后执行groupby
相关问题 更多 >
编程相关推荐