我有一个数据帧,其列id为:s,可以包含重复项:
>>> df['user_id'].head()
Out[3]:
0 2134
1 1234
2 4323
3 25434
4 1234
Name: user_id, dtype: int64
我怎样才能重新映射它,使得用户id从一个任意的数字开始,并根据原始数字递增?在本例中,将从2开始如下所示:
>>> df['user_id'].head()
Out[3]:
0 3
1 2
2 4
3 5
4 2
Name: user_id, dtype: int64
Tags:
IIUC,首先要根据该列中的值对df进行排序,然后使用
factorize
:然后可以使用
sort_index
还原索引:然后您可以覆盖或删除列,以上只是演示如何获得所需的值
这个问题有点让人困惑。。我不知道你是想增加一个任意数字的用户id,还是只想显示高于某个阈值的用户id。。。因此,我将给出两个问题的解决方案:
如果要对用户ID进行排序,可以:
希望有帮助!你知道吗
相关问题 更多 >
编程相关推荐