将每个组的唯一值计数为包含pandas的新列

df = pd.DataFrame({ 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) df.groupby('mID')['uID'].nunique()

2条回答

网友

1楼 · 编辑于 2024-06-16 12:40:27

你很亲密！在

df['ncount'] = df.groupby('mID')['uID'].transform(pd.Series.nunique)

      uID mID  ncount
0   James   A       5
1   Henry   B       2
2     Abe   A       5
3   James   B       2
4   Henry   A       5
5   Brian   A       5
6  Claude   A       5
7   James   C       1

网友

2楼 · 编辑于 2024-06-16 12:40:27

`GroupBy.transform('nunique')`

在v0.23.4上，你的解决方案对我有效。在

df['ncount'] = df.groupby('mID')['uID'].transform('nunique')
df
      uID mID  ncount
0   James   A       5
1   Henry   B       2
2     Abe   A       5
3   James   B       2
4   Henry   A       5
5   Brian   A       5
6  Claude   A       5
7   James   C       1

`GroupBy.nunique`+`pd.Series.map`

此外，使用现有的解决方案，您可以map将该系列返回mID：

^{pr2}$

`GroupBy.transform('nunique')`

`GroupBy.nunique`+`pd.Series.map`

相关问题更多 >

编程相关推荐

热门问题

热门文章

将每个组的唯一值计数为包含pandas的新列

GroupBy.transform('nunique')

GroupBy.nunique+pd.Series.map

相关问题 更多 >

编程相关推荐

热门问题

热门文章

`GroupBy.transform('nunique')`

`GroupBy.nunique`+`pd.Series.map`

相关问题更多 >