熊猫群组内删除重复项

2024-04-18 20:08:53 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的csv看起来像

name, cuisine, review
A, Chinese, this
A, Indian, is
B, Indian, an
B, Indian, example
B, French, thank
C, French, you

我试着数一数不同菜系的名字出现了多少次。这就是我应该得到的

^{pr2}$

但是正如你所看到的,名字里有重复的,例如B,所以我试着去掉重复的,但是我不能。我用

df.groupby('name')['cuisine'].drop_duplicates() 

它说groupby对象系列不能。在

不知怎么的,我需要应用value_counts()来获取烹饪词的出现次数,但是重复的东西阻碍了我的发展。你知道我怎么在熊猫身上得到这个吗?谢谢。在


Tags: csvnameyouanisexamplethis名字
2条回答

您正在查找groupbynunique

df.groupby('cuisine', sort=False).name.nunique().to_frame('count')

         count
cuisine       
Chinese      1
Indian       2
French       2

将返回每个组的唯一项的计数。在

使用crosstab

pd.crosstab(df.name,df.cuisine).ne(0).sum()
Out[550]: 
cuisine
 Chinese    1
 French     2
 Indian     2
dtype: int64

相关问题 更多 >