尝试根据仅有两列的df数据集，即“类型”和“性别”，找到每个性别最受欢迎的观看类型。

2条回答

网友

1楼 · 编辑于 2024-06-16 11:01:26

按列切片，然后运行此函数pd.Series.value_counts（） df["Gender"].value_counts()

网友

2楼 · 编辑于 2024-06-16 11:01:26

使用以下数据帧：

df = pd.DataFrame({
    'Genre': ['Romance', 'Tech', 'Romance', 'Comedy', 'Tech', 'Comedy', 'Romance', 'Romance',], 
    'Gender': ['Male', 'Male', 'Male', 'Female', 'Female', 'Male', 'Female', 'Male',]})

为计数添加一个额外的列：

df['value'] = 1

这将为您提供：

    Genre   Gender  value
0   Romance Male    1
1   Tech    Male    1
2   Romance Male    1
3   Comedy  Female  1
4   Tech    Female  1
5   Comedy  Male    1
6   Romance Female  1
7   Romance Male    1

然后根据两个字段“类型”和“性别”进行分组，并获得计数：

counts = df.groupby(['Genre', 'Gender']).count()

产出：

                value
Genre   Gender  
Comedy  Female  1
        Male    1
Romance Female  1
        Male    3
Tech    Female  1
        Male    1

您可以排序：

sorted = counts.sort_values(by='value', ascending=False)

并绘制：

sorted.plot(kind='bar', figsize=(15,8))

将为您提供：

相关问题更多 >

编程相关推荐

热门问题

热门文章

尝试根据仅有两列的df数据集，即“类型”和“性别”，找到每个性别最受欢迎的观看类型。

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >