计算Pandas的可能分组

Groups = {A,B}, {C,D}, {A,B,C}, {B,C}, {B,C,D} Count of Group {A,B} = 3 (Client 1-3-5) Count of Group {C,D} = 3 (Client 2-4) Count of Group {A,B,C} = 2 (Client 3-5) Count of Group {B,C} = 3 (Client 2-3-5) Count of Group {B,C,D} = 2 (Client 2,5)

1条回答

网友

1楼 · 发布于 2024-04-20 10:38:36

让我们尝试get_dummies来分隔Products，然后循环遍历组并计数：

Groups = [{'A','B'}, {'C','D'}, {'A','B','C'}, {'B','C'}, {'B','C','D'}]
s = df.Product.str.get_dummies(',')
out = pd.Series([s[list(group)].all(1).sum() for group in Groups], 
                index=list(map(tuple, Groups)))

输出：

(A, B)       3
(C, D)       3
(C, A, B)    2
(C, B)       3
(C, D, B)    2
dtype: int64

编程相关推荐

java Spark sample（）函数是否复制数据？
java如何在API中返回单例列表？
java我可以生成提供输入/输出的哈希函数吗？
如何“使用MATLAB或JAVA”从文本文件中读取数字并将其保存在数组中？
java如何将十进制转换为十六进制？
JavaPostXML文件
java XStream如何在XML中不存在带注释的字段时引发异常
java Tomcat启动批处理问题
java AccessControlException与同一代码库中的小程序类
java如何将长本地时间戳转换为字符串UTC时间戳

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算Pandas的可能分组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >