如何在最大值条件下保持重复观测?

2024-05-17 18:36:42 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的数据集的标题

   SM_id                                SM_nom  ...  MRS_CO_VER  Territoire
0    101               Montréal : Centre-ville  ...    V2017-08     3598479
1    102  Montréal : Centre-ville périphérique  ...    V2017-08    14048443
2    103                  Montréal : Sud-Ouest  ...    V2017-08    15130563
3    103                  Montréal : Sud-Ouest  ...    V2017-08         197
4    104        Montréal : Notre-Dame-de-Grâce  ...    V2017-08    10828311

SM_id变量中存在一些重复项。我只想保留在每个唯一的SM_idTerritoire变量上具有最大值的观察值

我试过这个:

MRC_to_SM = MRC_to_SM[MRC_to_SM.Territoire == MRC_to_SM.Territoire.max(level='SM_id')]

我得到了这个错误:

level name SM_id is not the name of the index

我应该如何进行

谢谢


Tags: thetonameidlevelsmalsud
1条回答
网友
1楼 · 发布于 2024-05-17 18:36:42

您使用了错误的函数idxmax是您正在寻找的:

idx = df.groupby('SM_id')['Territoire'].idxmax()
df = df[df.index.isin(idx)]

相关问题 更多 >