如何在scikitlearn中修复奇怪的预测结果

import pandas as pd from sklearn.model_selection import train_test_split from collections import * from sklearn.linear_model import LinearRegression features = pd.read_csv('data.csv') features.head() features_name = ['first' , 'second' , 'third'] target_name = ['target1','target2'] X = features[features_name] y = features[target_name] # Split the data into training and testing sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.155, random_state = 42) linear_regression_model = LinearRegression() linear_regression_model.fit(X_train,y_train) new_data = OrderedDict([('first',1600) ,('second',800),('third',480) ]) new_data = pd.Series(new_data).values.reshape(1,-1) ss = linear_regression_model.predict(new_data) print (ss)

1条回答

网友
1楼 · 发布于 2024-04-23 07:16:39

编辑：在你的输入（其中任何一个，基本上都是相同的）和你的target2之间没有线性关系。似乎是指数衰减。尝试将您的特征转换为另一个特征（1/exp（x）），然后您可以对该特征进行线性回归
我错了，只是1/x
还有。。（原文如下）我不是专家，但你的输入特征似乎不仅高度相关，它们实际上是完全相关的（即线性相关）-这通常会导致回归中断。直观的原因是，因为它们是相关的，存在着无限多的可能系数，它们相互反作用，预测结果仍然是完全相同的（想象一下，在你的例子中，第一秒与2first-3second或0first-1second等完全相同）。我还认为这会导致线性回归的正态方程产生一个不能反转的矩阵。。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章