我有一个由62名来自州立大学的本科生组成的数据框架,共有13栏(年龄、班级、专业、GPA等)
print(studentSurvey)
ID Gender Age Major ... Text Messages
1 F 20 Other 120
2 M 22 CS 50
.
.
.
62 F 21 Retail 200
我想在studentSurvey
上创建透视表。例如,我想知道有多少女性主修CS,男性主修其他课程,等等。我最接近的代码是:
studentSurvey.pivot_table(index="Gender", columns="Major", aggfunc='count')
Age ... Text Messages
Major Accounting CIS Economics/Finance ... Other Retailing/Marketing Undecided
Gender ...
Female 3.0 3.0 7.0 ... 3.0 9.0 NaN
Male 4.0 1.0 4.0 ... 4.0 5.0 3.0
这不是我所需要的。我只需要Gender
作为索引(行),其中Major
下的所有唯一值都是列,每个单元格都包含该性别和主次的计数。我也尝试过只对这两列进行切片和旋转,但结果混淆了。有人能提出更好的建议吗?我对大熊猫的高级整形还不熟悉
检查
crosstab
修正你的代码
尝试:
或者您可以执行
crosstab
:相关问题 更多 >
编程相关推荐