我正在自学Python,通过各种教程,然后将其重新应用到我自己的自定义数据集。我在重新构造数据以使用我发现的关联规则教程时遇到问题
参考文献: http://aimotion.blogspot.com/2013/01/machine-learning-and-data-mining.html
我的数据结构:
目标结构:“[[1,3,4],[2,3,5],[1,2,3,5],[2,5]]”。。。客户购买的产品清单。我不需要客户的名字。你知道吗
因此,对于每个客户,我需要删除二进制值为0的产品。并按产品名称而不是二进制值1创建他们购买的产品的列表。你知道吗
有人帮忙吗?我的数据集有6.2万个客户,所以手工操作需要很长时间
假设你的数据在第一张纸上:
结果:
相关问题 更多 >
编程相关推荐