我有一个数据集,它跟踪用户何时阅读网站。用户可以在任何时候阅读网站,因此用户会多次出现。我想创建一个列,跟踪用户阅读特定网站的次数。但由于它是一个时间序列,计数应该是递增的。我有大约28gbs,所以pandas将无法处理工作负载,所以我必须用sql编写它。你知道吗
样本数据如下:
Date ID WebID
201901 Bob X-001
201902 Bob X-002
201903 Bob X-001
201901 Sue X-001
预期结果:
Date ID WebID Count
201901 Bob X-001 1
201902 Bob X-002 1
201903 Bob X-001 2
201901 Sue X-001 1
您可以使用以下sql查询:
使用行号()
相关问题 更多 >
编程相关推荐