Pandas数据帧中的分组依据

2024-04-20 09:39:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我觉得我遗漏了一些非常简单的东西,有人能告诉我这个代码有什么问题吗?在

我试着按性别分组,年龄大于30岁,存活值=1。在

“Sex”是一个布尔值(1或0),如果这有区别的话

data_r.groupby('Sex')([data_r.Age >30],[data_r.Survived == 1]).count()

这是投掷: “'DataFrameGroupBy'对象不可调用”

有什么想法吗?谢谢


Tags: 对象代码agedatacountgroupby性别年龄
2条回答

你可以在分组前进行筛选。在

data_r.query('Age > 30 and Survived == 1').groupby('Sex').count()

输出:

^{pr2}$

伊荷。。。我会使用size它更安全,count不包括null值(NaN值)。注意这些列中的不同值这是由于NaN值造成的。在

data_r.query('Age > 30 and Survived == 1').groupby('Sex').size()

输出:

Sex
female    83
male      41
dtype: int64

你需要先过滤,然后是groupby。在

data_r[(data_r.Age>30) & (data_r.Survived==1)].groupby('Sex').count()

相关问题 更多 >