熊猫群组内删除重复项 - 问答 - Python中文网

熊猫群组内删除重复项

2024-04-18 20:08:53 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

这是我的csv看起来像

name, cuisine, review
A, Chinese, this
A, Indian, is
B, Indian, an
B, Indian, example
B, French, thank
C, French, you

我试着数一数不同菜系的名字出现了多少次。这就是我应该得到的

^{pr2}$

但是正如你所看到的，名字里有重复的，例如B，所以我试着去掉重复的，但是我不能。我用

df.groupby('name')['cuisine'].drop_duplicates()

它说groupby对象系列不能。在

不知怎么的，我需要应用value_counts（）来获取烹饪词的出现次数，但是重复的东西阻碍了我的发展。你知道我怎么在熊猫身上得到这个吗？谢谢。在

Tags： csv name you an is example this 名字

2条回答

网友

1楼 · 编辑于 2024-04-18 20:08:53

您正在查找groupby和nunique：

df.groupby('cuisine', sort=False).name.nunique().to_frame('count')

         count
cuisine       
Chinese      1
Indian       2
French       2

将返回每个组的唯一项的计数。在

网友

2楼 · 编辑于 2024-04-18 20:08:53

使用crosstab

pd.crosstab(df.name,df.cuisine).ne(0).sum()
Out[550]: 
cuisine
 Chinese    1
 French     2
 Indian     2
dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章