我有一个数据集,我试图用sklearn来计算线性回归。 我使用的数据集已经制作好了,所以应该不会有问题。 我使用了train\u test\u split,以便将数据拆分为train和test组。 当我尝试使用matplotlib在ttest和prediction组之间创建散点图时,出现下一个错误:
ValueError: x and y must be the same size
这是我的密码:
y=data['Yearly Amount Spent']
x=data[['Avg. Session Length','Time on App','Time on Website','Length of Membership','Yearly Amount Spent']]
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=101)
#training the model
from sklearn.linear_model import LinearRegression
lm=LinearRegression()
lm.fit(x_train,y_train)
lm.coef_
predictions=lm.predict(X_test)
#here the problem starts:
plt.scatter(y_test,predictions)
为什么会出现这种错误? 我在这里看到过以前的帖子,建议使用x.shape和y.shape,但我不确定这样做的目的是什么。你知道吗
谢谢
似乎您正在使用
EcommerceCustomers.csv
数据集(link here)在您最初的帖子中,
'Yearly Amount Spent'
列也包含在y
和x
中,但这是错误的。你知道吗以下操作应该可以正常工作:
另见this
相关问题 更多 >
编程相关推荐