将序列号添加到表中的groupby（）.head（n）表达式

Country | Value ---------------------|------ Germany | 102.1 Germany | 90.3 Germany | 44.6 Switzerland | 59.9 Switzerland | 35.3 Switzerland | 21.6 ...and so on

Country | Value | Rank ---------------------|--------|------ Germany | 102.1 | 1 Germany | 90.3 | 2 Germany | 44.6 | 3 Switzerland | 59.9 | 1 Switzerland | 35.3 | 2 Switzerland | 21.6 | 3 ...and so on

1条回答

网友

1楼 · 发布于 2024-04-26 07:19:19

我相信您需要^{}和method='dense'，因为通过转换为integers列的排序值，组之间的排名始终增加1：

df['Rank'] = df.groupby("Country")["Value"].rank(method='dense', ascending=False).astype(int)
print (df)
       Country  Value  Rank
0      Germany  102.1     1
1      Germany   90.3     2
2      Germany   44.6     3
3  Switzerland   59.9     1
4  Switzerland   35.3     2
5  Switzerland   21.6     3

如果需要计数器，则最好使用^{}：

df['Rank1'] = df.groupby("Country").cumcount() + 1

变化的数据最能体现差异：

print (df)
       Country  Value
0      Germany   90.3 second largest per group - 2
1      Germany  102.1 largest per group - 1
2      Germany   44.6 third largest per group - 3
3  Switzerland   21.6
4  Switzerland   35.3
5  Switzerland   59.9

df['Rank'] = df.groupby("Country")["Value"].rank(method='dense', ascending=False).astype(int)
df['Rank1'] = df.groupby("Country").cumcount() + 1

print (df)
       Country  Value  Rank  Rank1
0      Germany   90.3     2      1
1      Germany  102.1     1      2
2      Germany   44.6     3      3
3  Switzerland   21.6     3      1
4  Switzerland   35.3     2      2
5  Switzerland   59.9     1      3

相关问题更多 >

编程相关推荐

热门问题

热门文章

将序列号添加到表中的groupby（）.head（n）表达式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >