数据集包含4列,其中name是孩子的名字,yearofbirth是孩子出生的年份,number是用这个名字命名的婴儿的数量。你知道吗
For example, entry 1 reads, in the year 1880, 7065 girl children were named Mary.
通过熊猫,我每年都想知道哪个名字是最常用的。我的代码
df.groupby(['yearofbirth']).agg({'number':'max'}).reset_index()
上面的代码部分地回答了手头的问题。你知道吗
我想要名字和最大号码。你知道吗
根据this question的答案,我想出了这个解决方案:
我认为,如果每年只有一个最大值-^{} 和^{} ,则需要:
如果每年可能有多个最大值,请使用@Teoretic解决方案。你知道吗
你可以试试这个;
sort
并得到last
值或者可以使用
reindex
演示:
相关问题 更多 >
编程相关推荐