优化 RandomForestRegressor 以适应其他指标
sklearn的随机森林文档页面上写着:
唯一支持的标准是“mse”,也就是均方误差。
我的数据比较杂乱,还有一些异常值,我觉得使用绝对误差(MAE)或者其他更稳健的惩罚函数会效果更好。
有没有办法让随机森林回归器使用其他指标,比如说通过迭代的方式,或者有没有其他的开源Python替代方案?还是说我对需要其他指标的想法本身就是错的?sklearn在其他方面做得很好,所以我觉得只支持均方误差在这么重要的随机森林方法上有点奇怪。
1 个回答
4
你可以使用 GridSearchCV 或 RandomizedSearchCV 来在交叉验证的过程中优化其他标准。虽然这些森林模型本身还是会优化均方误差(MSE),但交叉验证的过程会在你选择的参数设置中找到最适合你关注的实际标准的森林模型。(而且它优化的是交叉验证的得分,而不是训练集的得分。)