列上出现pandas groupby count字符串 - 问答 - Python中文网

列上出现pandas groupby count字符串

2024-06-08 23:52:22 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想计算分组pandas数据帧列中字符串的出现次数。

假设我有以下数据帧：

catA    catB    scores
A       X       6-4 RET
A       X       6-4 6-4
A       Y       6-3 RET
B       Z       6-0 RET
B       Z       6-1 RET

首先，我想按catA和catB分组。对于这些组中的每一个，我想计算scores列中RET的出现次数。

结果应该是这样的：

catA    catB    RET
A       X       1
A       Y       1
B       Z       2

按两列分组很简单：grouped = df.groupby(['catA', 'catB'])

但接下来呢？

Tags：数据字符串 pandas df 次数 groupby ret scores

1条回答

网友

1楼 · 发布于 2024-06-08 23:52:22

在^{}对象的“scores”列上调用^{}，并使用矢量^{}方法^{}，使用此方法筛选group，然后调用^{}：

In [34]:    
df.groupby(['catA', 'catB'])['scores'].apply(lambda x: x[x.str.contains('RET')].count())

Out[34]:
catA  catB
A     X       1
      Y       1
B     Z       2
Name: scores, dtype: int64

若要指定为列，请使用^{}，以便聚合返回一个序列，其索引与原始df对齐：

In [35]:
df['count'] = df.groupby(['catA', 'catB'])['scores'].transform(lambda x: x[x.str.contains('RET')].count())
df

Out[35]:
  catA catB   scores count
0    A    X  6-4 RET     1
1    A    X  6-4 6-4     1
2    A    Y  6-3 RET     1
3    B    Z  6-0 RET     2
4    B    Z  6-1 RET     2

相关问题更多 >

编程相关推荐

热门问题

热门文章