我已将客户列表导入python以运行一些RFM分析,这为RFM类的数据添加了一个新字段,因此现在我的数据如下所示:
customer RFMClass
0 0001914f-4655-4148-a1dc-1f25ca6d1f15 343
1 0002e50a-5551-4d9a-8734-76307dfe2131 341
2 00039977-512e-47ad-b929-170f18a1b14a 442
3 000693ff-2c61-425c-97c1-0286c874dd2f 443
4 00095dc2-7f37-48b0-894f-910d90cbbee2 142
5 000b748b-7ea0-48f2-a875-5f6cb95561d9 141
...
我想绘制一个直方图,显示每个RFM类中的客户数量,如何计算每个类中不同客户ID的数量
我试着在每一行中添加一个1
,summary['number'] = 1
认为计算这些ID可能比计算客户ID更容易,因为这些ID在我的代码中已经消除了重复,但是我也不知道如何对每个RFM类求和
你觉得我该怎么做
我通过在我的RFM类中使用
.groupby
并对分配给每一行的“数字”求和来解决这个问题:然后产生所需的输出:
相关问题 更多 >
编程相关推荐