如何计算pythonPandas中最常见的3种类型?

2024-06-01 01:10:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧与一列,我需要返回3个最常见的流派

INPUT

    genres
0   Drama
1   Animation|Children's|Musical
2   Musical|Romance
3   Drama
4   Animation|Children's|Comedy
5   Action|Adventure|Comedy|Romance
6   Action|Adventure|Drama
7   Comedy|Drama
8   Animation|Children's|Musical
9   Adventure|Children's|Drama|Musical
10  Animation|Children's|Musical
11  Musical
12  Drama
13  Comedy

戏剧6 音乐剧6 儿童5 动画4 喜剧4 冒险3 行动2

OUTPUT - A dataframe with:

  genres
0 Drama
1 Musical
2 Children's

Tags: 数据inputaction儿童childrengenresadventureanimation
1条回答
网友
1楼 · 发布于 2024-06-01 01:10:24

您首先需要split,dostack,然后使用value_counts

df.genres.str.split('|',expand=True).stack().value_counts().head(3)
Drama         6
Musical       6
Children's    5
dtype: int64

相关问题 更多 >