使用ScikitLearn与GraphLab Create的线性回归。相同的数据,不同的结果

2024-04-26 23:21:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我用GraphLab Create和sciket Learn分别对一些数据(西雅图县的房价)建立了多元线性回归模型。测试和训练集是随机选择的,但我使用了相同的划分(80/20)。然而,结果却大相径庭。你知道吗

GraphLab模型的平均误差为106254.49,而Scikit学习模型的平均误差为168980.44

创建GraphLab模型的代码来自一个在线课程,所以我假设它是正确的。我为Scikit模型编写的一个示例是:

model = LinearRegression().fit(train_features,train_target)
test_predictions = model.predict(test_features)
errors = abs(test_predictions - test_target)

我知道这两个模型的数据并不完全相同,因为这两个样本都是随机选择的,但是如果训练集的大小约为17k行,测试集的大小约为4k行,我预计不会有太大的差异。你知道吗

有什么建议吗?我用Scikit线性回归做了什么错事吗?你知道吗

本质上,我希望能够使用Scikit复制GraphLab模型,期望获得非常相似的性能。你知道吗

谢谢


Tags: 数据模型testtargetmodelcreatetrain线性