我有一个包含姓名、身高、体重和出生日期等个人数据的数据集。我会用一个特定的月份和年份出生的人数建立一个图表。我正在使用python pandas来完成这项工作,我的策略是尝试按年和月分组并添加using count。但我得到的最接近的数据是按年或按月计算人数,而不是两者都计算。
df['birthdate'].groupby(df.birthdate.dt.year).agg('count')
stackoverflow中的其他问题指向一个名为TimeGrouper的Grouper,但是在pandas文档中搜索时什么也没有找到。知道吗?
您还可以使用带有} 的“每月”时段:
dt
访问器的^{值得注意的是,如果datetime是可以使用的索引(而不是列),则可以使用^{} :
要按多个条件分组,请传递列或条件的列表:
示例:
更新
从版本^{} 开始,由于多索引级别名称必须唯一的限制,上述代码不再工作,现在需要
rename
级别才能工作:另一种解决方案是将
birthdate
设置为索引并重新采样:输出:
相关问题 更多 >
编程相关推荐