处理包含多个值的pandas列以进行数据分析

2024-06-07 02:58:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个以'genre'作为列的数据帧。在此列中,每个条目都有多个值。例如,一部电影《哈利波特》可能会在类型栏中出现幻想、冒险。在我进行数据分析和探索时,我不知道如何用多个值来表示这个列,以显示电影和/或流派之间的任何关系。在

我曾想过用图表分析来显示这种关系,但我想探讨一下我可以考虑的其他方法?在


Tags: 数据方法类型电影关系条目用图表幻想
1条回答
网友
1楼 · 发布于 2024-06-07 02:58:28

您可以按流派使用^{}作为新指标列:

df = pd.DataFrame({'Movies': ['Harry Potter', 'Toy Story'],
                   'Genres': ['fantasy,adventure', 
                              'adventure,animation,children,comedy,fantasy']})

#print (df)


df = df.set_index('Movies')['Genres'].str.get_dummies(',')
print (df)
              adventure  animation  children  comedy  fantasy
Movies                                                       
Harry Potter          1          0         0       0        1
Toy Story             1          1         1       1        1

相关问题 更多 >