当每个季节有不同的模型时预测价格

from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split modeling = data.loc[:,["shipping_distance","season_int","new_cust_int","express_shipment","shipping_charge"]] x =modeling.iloc[:,:-1] y =modeling.iloc[:,-1:] X_train, X_test, y_train, y_test = train_test_split(x,y, random_state = 1) model = LinearRegression() model.fit(X_train, y_train) model.predict(X_test)

3条回答

网友

1楼 · 编辑于 2024-04-25 18:53:05

这里您使用标签编码器来表示“季节”（1,2,3,4）和线性回归。这意味着您为这个模型分配了一些内在的顺序。您可以尝试对“season_int”进行一种热编码：

https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

网友

2楼 · 编辑于 2024-04-25 18:53:05

可能的答案：

您正在使用分类变量进行线性回归，这可能是一个问题Here是可能的解决方案
线性回归可能不是解决问题的最佳模型，因为您的问题可能不是线性的。试试非线性模型，例如sklearn.ensemble.RandomForestRegressor
对于您试图解决的问题，您的数据集可能没有足够的价值。这些变量可能不是决定价格等的最佳变量
您没有足够的数据来训练您的模型

网友

3楼 · 编辑于 2024-04-25 18:53:05

似乎您需要一个时间序列模型[是吗？]https://www.statsmodels.org/stable/examples/index.html#time-series-analysis

相关问题更多 >

编程相关推荐

热门问题

热门文章