如何对隐式d应用Spark-ALS

2024-06-08 13:13:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据集是这样的购买历史:

+---+-----------+---------+
|usn|    page_id|    click|
+---+-----------+---------+
| 11| 9000001012|       10|
|169| 2010008901|      100|
|169| 9000001007|        4|
|169| 2010788901|        1|
|169| 8750001007|        4|
|169| 9003601012|       10|
|169| 9000001007|        4|
|613| 9000050601|        8|
|613| 9000011875|        3|
|613| 2010010401|        6|
|613| 9000001007|        4|
|613| 2010008801|        1|
|836| 9000050601|       20|
|916| 9000050601|       10|
|916| 9000562601|       30|
|916| 9000001007|        4|
|916| 9000001012|       10|
+---+-----------+---------+

我读过Spark(http://spark.apache.org/docs/latest/ml-collaborative-filtering.html)中的文档,但我不知道如何在这个问题中使用协作过滤来获得隐含的偏好。在

现在我想对这个数据集应用ALS作为隐式首选项。 怎么做?我可以将此数据集应用于显式数据吗?在

请帮助我使用它,并给我一个关于隐式优先权的示例代码python


Tags: 数据orgidhttpdocsapachepage历史