依次增加计数

2024-06-11 10:41:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,它跟踪用户何时阅读网站。用户可以在任何时候阅读网站,因此用户会多次出现。我想创建一个列,跟踪用户阅读特定网站的次数。但由于它是一个时间序列,计数应该是递增的。我有大约28gbs,所以pandas将无法处理工作负载,所以我必须用sql编写它。你知道吗

样本数据如下:

Date    ID  WebID
201901  Bob X-001
201902  Bob X-002
201903  Bob X-001
201901  Sue X-001

预期结果:

Date    ID  WebID   Count
201901  Bob X-001   1
201902  Bob X-002   1
201903  Bob X-001   2
201901  Sue X-001   1

Tags: 数据用户idpandassqldate网站时间