2024-04-20 00:25:32 发布
网友
我有一个pandas数据帧,我正在执行groupby(['target']).count()。这个很好用。但是,对于每个组,我想要的一件事是ID列中唯一元素的数量。在
我想做的是,对于ID列,除了第一个ID值的副本之外,将所有ID值都清空(ID对于组是唯一的,所以我不必担心这个问题)。然后,groupby().count()将给出每个组中唯一ID的数量。。。但我不知道该怎么做。在
如果您想按照您描述的方式来操作,DataFrame.duplicated()方法在这里是适用的。它可以返回第一次出现ID为False,其余为True的序列。然后您可以使用这个掩码将重复的id设置为null。在
DataFrame.duplicated()
参见:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.duplicated.html
如果您想按照您描述的方式来操作,
DataFrame.duplicated()
方法在这里是适用的。它可以返回第一次出现ID为False,其余为True的序列。然后您可以使用这个掩码将重复的id设置为null。在参见:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.duplicated.html
相关问题 更多 >
编程相关推荐