我目前正在处理一个大型电影数据集,我已将其筛选为两列:Genre
和Gender
要将此可视化:
Genre: Gender:
Romance Male
Tech Male
Romance Male
Comedy Female
Tech Female
Comedy Male
Romance Female
Romance Male
我想按性别显示前三大最受欢迎的类型,但我似乎无法获得正确的代码
我所尝试的:
df_final_gender['name'].groupby(df_final_gender['GENDER']).describe()
这只显示了每种性别中最受欢迎(排名前)的类型。我想要每个性别的前三名,任何帮助都是感激的
按列切片,然后运行此函数pd.Series.value_counts()
df["Gender"].value_counts()
使用以下数据帧:
为计数添加一个额外的列:
这将为您提供:
然后根据两个字段“类型”和“性别”进行分组,并获得计数:
产出:
您可以排序:
并绘制:
将为您提供:
相关问题 更多 >
编程相关推荐