如何在包含缺失行的数据中进行聚合?

2024-04-16 07:51:39 发布

您现在位置:Python中文网/ 问答频道 /正文

有一个带有(id,x)对的数据帧和一个感兴趣的id列表

我可以得到每个感兴趣的ID的x的总和,这可以通过df[['id','x']].groupby('id').agg('sum')实现

但如果没有特定ID的记录,它将不会显示在结果中。如何为此类ID获取零?在SQL中,这将是一个外部联接

示例数据:

id  x
------
1   10
1   12
2   27
4   49

对于感兴趣的ID [1,2,3,4],预期结果是:

1  22
2  27
3  0
4  49

Tags: 数据id示例df列表sql记录感兴趣