我有一个以国家名称作为行索引的数据框,还有一个以大陆/国家对作为行索引的字典,如下所示:
ContinentDict = {'China':'Asia',
'United States':'North America',
'Japan':'Asia',
'United Kingdom':'Europe',
'Russian Federation':'Europe',
'Canada':'North America',
'Germany':'Europe',
'India':'Asia',
'France':'Europe',
'South Korea':'Asia',
'Italy':'Europe',
'Spain':'Europe',
'Iran':'Asia',
'Australia':'Australia',
'Brazil':'South America'}
我想使用groupby函数根据这些大陆对数据帧进行分组。我曾考虑将大陆合并为数据框架的附加列,但这似乎很笨拙。在这种情况下,最佳做法是什么
谢谢
PS:对于Python中字典的使用以及如何与数据帧一致地使用它们,我通常有点困惑
编辑:我最初的国家数据框架中有一些关于人口统计的列。按大陆分组后,我的工作流程的下一步是计算每个大陆的平均值、标准偏差等
可以执行以下操作并按grouped.groups显示组,这将为您提供组及其索引。但是,将序列传递给groupby的唯一缩减是序列将具有与数据帧相同的长度
相关问题 更多 >
编程相关推荐