按第二个系列中的值计算客户数

2024-06-08 20:26:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我已将客户列表导入python以运行一些RFM分析,这为RFM类的数据添加了一个新字段,因此现在我的数据如下所示:

                                   customer RFMClass
    0  0001914f-4655-4148-a1dc-1f25ca6d1f15      343
    1  0002e50a-5551-4d9a-8734-76307dfe2131      341
    2  00039977-512e-47ad-b929-170f18a1b14a      442
    3  000693ff-2c61-425c-97c1-0286c874dd2f      443
    4  00095dc2-7f37-48b0-894f-910d90cbbee2      142
    5  000b748b-7ea0-48f2-a875-5f6cb95561d9      141
...

我想绘制一个直方图,显示每个RFM类中的客户数量,如何计算每个类中不同客户ID的数量

我试着在每一行中添加一个1summary['number'] = 1认为计算这些ID可能比计算客户ID更容易,因为这些ID在我的代码中已经消除了重复,但是我也不知道如何对每个RFM类求和

你觉得我该怎么做


Tags: 数据idnumber列表数量客户绘制customer
1条回答
网友
1楼 · 发布于 2024-06-08 20:26:04

我通过在我的RFM类中使用.groupby并对分配给每一行的“数字”求和来解决这个问题:

byhour = df.groupby(['Hour']).agg({'Orders': 'sum'})

print(byhour)

然后产生所需的输出:

      Orders
Hour        
0        902
1        438
2        307
3        162
4        149
5        233
6        721

相关问题 更多 >