使用scikit learn（sklearn），如何处理线性回归的缺失数据？

X = DataFrame_1 for col in DataFrame_2.columns: y = DataFrame_2[col] model = LinearRegression() model.fit(X,y) #ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

2条回答

网友

1楼 · 编辑于 2024-05-20 02:03:21

如果变量是数据帧，则可以使用fillna。在这里，我用该列的平均值替换了丢失的数据。

df.fillna(df.mean(), inplace=True)

网友

2楼 · 编辑于 2024-05-20 02:03:21

您可以用插补来填写y中的空值。在scikit-learn中，使用以下代码段完成此操作：

from sklearn.preprocessing import Imputer
imputer = Imputer()
y_imputed = imputer.fit_transform(y)

否则，您可能希望使用74列的子集作为预测值来构建模型，也许您的某些列包含的空值更少？

编程相关推荐

如何使用SeleniumWebDriver捕获特定元素的屏幕截图而不是整个页面？
WAS 8.5中的java JAXWS异步IO异常
java Android Studio无法解析数组适配器中的符号项
swing Java在运行时添加和删除按钮
java Spring Boot 2.0。x禁用特定配置文件的安全性
java这是我的最后一个代码，我在“if（Users[B].substring（0,1）==“1”）{//Find String Cut Char Function”上遇到错误
单击菜单选项后打开“活动”时发生java错误
java Tic Tac Toe NullPointerException
java如何做数学题。随机进入for循环
java Http状态404错误处理spring mvc

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用scikit learn（sklearn），如何处理线性回归的缺失数据？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >