我正在努力学习Python/Pandas,我认为这是一个非常基本的问题。在
我有以下表格的数据:
id X
1 1
1 2
2 2
2 3
3 4
3 5
3 5
3 3
3 3
3 4
4 3
4 4
4 6
我想用类似于unstack
格式转换数据:我想按id
分组,对X
值进行排序,将第一个X
-值放入x1
,第二个X
-值放在x2
中,等等。数据集相当大(超过1百万行)。X
中的大多数值都是唯一的(因此我不想使用X的值作为列名,而是使用X的顺序。完成后,我希望得到一个如下所示的数据帧:
^{pr2}$
Tags:
你可以做点什么
一步一步,首先我们可以删除重复项并排序:
^{pr2}$然后我们可以对groupby中的元素进行排序,并构建要在列中使用的适当值(
cumcount
在这里也可以使用):最后,我们将重点放在:
如果您坚持:
相关问题 更多 >
编程相关推荐