在我的例子中,如何生成数据的特征,以便我可以使用一些工具,如线性回归来预测?

2024-03-29 08:09:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我是这个领域的新手。我想分析一下,作为一个零售商,哪些顾客在我的促销活动中购买了我的商品,会成为一个忠诚的顾客。我有一个在促销期间的用户操作和用户信息列表,还有一个客户和商户对列表,其客户被称为对商户忠诚。我还有另外一份客户和商家对的名单,我需要预测他们是否会有忠诚的关系。数据相当大,我在这里放了几行。你知道吗

user_id item_id cat_id  merchant_id brand_id    time_stamp  action_type
168006  348194  544     692         517         625         0
168006  768080  984     706         1060        1016        1
168006  810877  284     692         517         625         2

user_id#merchant_id prob
7562#3571           0
7562#4784           0
7562#3404           1

分类号:产品类别
动作类型:代表像添加到购物车,购买,添加到最喜爱的东西

我想我可以用sklearn.linear\u模型.LinearRegression来预测我的预测列表中的prob项,方法是将每个用户#可能的对作为一个项。这里的prob表示如果1忠诚,如果0则不忠诚,在新列表中,prob将是一个float num

我仍然有一个用户信息列表,这是很容易处理,我不会把它放在这里。但是我不知道如何从我的用户操作列表中生成特性。你能给我一些建议吗?事实上,我仍然不知道我应该使用线性回归还是更好的工具?你知道吗


Tags: 用户信息id列表客户merchant领域商品
1条回答
网友
1楼 · 发布于 2024-03-29 08:09:22

这是个很好的问题。您在这里捕获到的是,您有一些数据(与商家相关联的用户操作),您希望将其转换为洞察力(用户与商家有更多操作的概率)。你知道吗

这个问题与Netflix的问题非常相似。他们有观众(比如你的客户)和电影(比如你的商家或产品),他们需要知道观众在看电影之前会喜欢什么电影。这是一个推荐系统。你知道吗

这里有一个关于这个主题的好课程:https://www.coursera.org/learn/ml-recommenders

从概念的角度来看,您要做的是了解每个客户的偏好向量和每个商家的描述向量。偏好向量和描述向量组合以确定推荐。你知道吗

如果我要在神经网络中实现这一点,我会做以下工作:

1对客户进行热编码,并将其在前馈网络中连接到几个节点。如果您认为有5个不同的偏好维度,那么使用5个节点。可能多达10个。你知道吗

1对商户进行热编码,并将其在前馈网络中连接到几个节点。如果你认为商家价值有5个不同的维度,那么使用5个节点。可能低至3。你知道吗

在客户和商户的1热编码之上的这两个较小的层为商户和客户建立了降维层,并将对他们的偏好进行编码。你知道吗

现在将两个网络再输入一个小层(可能又是5个节点),然后输入两个输出节点(1个表示不适合,1个表示不适合)。你知道吗

根据训练数据训练整个配置。最后,您将了解客户的偏好、对商家的描述以及他们在概念上的匹配方式。你知道吗

当你有一个新的客户或商人,你的任务是发现他们的向量,而不是重新计算一切。你可以使用像K-means这样的技术来寻找像那个顾客一样的顾客或者像商人一样的商人。你知道吗

相关问题 更多 >