如何使用分组方法将两列合并为第三列提取属性？

income_bracket credit_scores 'very low' 0.0 2340 1.0 456 'moderate' 0.0 1234 1.0 657 'high' 0.0 54 1.0 657 'very high' 0.0 9 1.0 1234

1条回答

网友

1楼 · 发布于 2024-04-16 10:40:44

您需要^{}来获取每个组的index值，该值在val中最大，然后按^{}选择这些行：

#dta.reset_index(inplace=True)
#dta = dta.reset_index().rename(columns={0: 'val'}) 
print (dta)
  income_bracket  credit_score   val
0       very low           0.0  2340
1       very low           1.0   456
2       moderate           0.0  1234
3       moderate           1.0   657
4           high           0.0    54
5           high           1.0   657
6      very high           0.0     9
7      very high           1.0  1234

print (dta.groupby(['income_bracket'], sort=False)['val'].idxmax())
income_bracket
very low     0
moderate     2
high         5
very high    7
Name: val, dtype: int64

#select all columns
print (dta.ix[dta.groupby(['income_bracket'], sort=False)['val'].idxmax()])
  income_bracket  credit_score   val
0       very low           0.0  2340
2       moderate           0.0  1234
5           high           1.0   657
7      very high           1.0  1234

#select columns income_bracket and credit_score
print (dta.ix[dta.groupby(['income_bracket'], sort=False)['val'].idxmax(), 
             ['income_bracket','credit_score']])
  income_bracket  credit_score
0       very low           0.0
2       moderate           0.0
5           high           1.0
7      very high           1.0

#select column credit_score    
print (dta.ix[dta.groupby(['income_bracket'], sort=False)['val'].idxmax(), 'credit_score'])
0    0.0
2    0.0
5    1.0
7    1.0
Name: credit_score, dtype: float64

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用分组方法将两列合并为第三列提取属性？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >