2024-04-26 19:14:47 发布
网友
我一直在尝试用ALS训练模型Pypark.ALS.建议. 代码:
from pyspark.ALS.recommendation import ALS model=ALS.train(trainingset,rank=8,seed=0,iterations=10,lambda_=0.1)
但我得到以下错误:
invalid literal for int() with base 10: 'userId'
好吧,错误消息意味着您正在传递一些“userId”文本,其中需要一个数字。如果没有进一步的信息(如完整的错误消息或stacktrace),很难说到底是什么问题。你知道吗
编辑:正如在评论中提到的,原来您有来自CSV的“header”行作为“trainingset”数据的第一行。这就是问题的原因。您只需要确保跳过标题行—例如,通过遵循How do I skip a header from CSV files in Spark?
好吧,错误消息意味着您正在传递一些“userId”文本,其中需要一个数字。如果没有进一步的信息(如完整的错误消息或stacktrace),很难说到底是什么问题。你知道吗
编辑:正如在评论中提到的,原来您有来自CSV的“header”行作为“trainingset”数据的第一行。这就是问题的原因。您只需要确保跳过标题行—例如,通过遵循How do I skip a header from CSV files in Spark?
相关问题 更多 >
编程相关推荐