分组方式+聚合+大Pandas计数

2024-05-01 21:55:26 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有一个包含员工销售信息的表。目前,我主要关心的是每个员工有多少销售/客户。我对总计数(员工销售给的总客户数)和唯一计数(员工销售给的唯一客户数)都感兴趣。为此,我查看了Employee_idCustomer_id列(尽管也有其他列)在Sales数据集中。它们看起来像这样:

  | Employee_id | Customer_id
 1|      'E122' |      'C921' ...
 2|      'E122' |      'C221' ...
 3|      'E43'  |      'C365' ...
 4|      'E122' |      'C221' ...
 5|      'E57'  |      'C138' ...
 ...

两列都包含表示ID的字符串。现在,我有以下内容,但我得到一个'int'对象是不可调用的错误,我不知道为什么。你知道吗

Sales.groupby('Employee_id').agg({
'counts': [
    ('Customer_id', count)
]})

我不确定我做错了什么,以及“int”相关的错误是从哪里来的。我通常看到过summax这样的聚合函数,但没有count那么多,所以这可能是问题所在。另外,如果我想计算独特的客户以及,我会怎么做呢?你知道吗

谢谢你的帮助!你知道吗


Tags: 信息id客户count错误员工employeecustomer