如何让PySpark ALS for Recommension system返回测试集数据?

2024-05-16 11:41:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着模仿这个Kaggle中的Pypark ALS代码 https://www.kaggle.com/vikashrajluhaniwal/matrix-factorization-recommendation-using-pyspark

我注意到当你使用代码时

model.recommendForAllUsers(3).show()

输出仅包括培训集中的用户数(58971个用户)

我想知道您如何获得测试集(其他44819用户)的推荐??我尝试过搜索其他教程,但我仍然不知道如何获得完整数据集的预测

或者我只是使用最佳模型的参数,然后在不分割的情况下再次训练整个数据集

非常感谢你的回答


Tags: 数据代码用户httpscomwwwmatrixusing