我有一个数据帧:
HH PERSON SPOT WEIGHT
1002141 aa 1 1332.25
1011831 ab 1 2083.31
1031726 aa 1 2589.09
1042819 aa 1 4736.28
1043006 aa 1 1588.39
1043006 aa 1 1588.39
1060911 aa 1 1113.97
1001665 aa 2 3202.09
1001762 aa 2 2048.54
我要做的是创建一个count列所有重复的事件, 在上面的示例中,第5行和第6行是相同的,所以我希望输出为:
^{pr2}$我所做的是:
count_table=df.groupby(['HH','PERSON','SPOT ID']).agg(['count']).reset_index()
它可以工作,但是索引会变得一团糟——它按HH列而不是原始索引对其进行排序。在
有什么办法可以重置表索引吗?在
您可以为此使用
transform
来添加一个count列,在这种情况下,它只是组大小:相关问题 更多 >
编程相关推荐