pysp中的交替最小二乘误差

2024-04-26 19:14:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在尝试用ALS训练模型Pypark.ALS.建议. 代码:

from pyspark.ALS.recommendation import ALS 
model=ALS.train(trainingset,rank=8,seed=0,iterations=10,lambda_=0.1)

但我得到以下错误:

invalid literal for int() with base 10: 'userId'

Tags: 代码from模型importmodeltrain建议pyspark
1条回答
网友
1楼 · 发布于 2024-04-26 19:14:47

好吧,错误消息意味着您正在传递一些“userId”文本,其中需要一个数字。如果没有进一步的信息(如完整的错误消息或stacktrace),很难说到底是什么问题。你知道吗

编辑:正如在评论中提到的,原来您有来自CSV的“header”行作为“trainingset”数据的第一行。这就是问题的原因。您只需要确保跳过标题行—例如,通过遵循How do I skip a header from CSV files in Spark?

相关问题 更多 >