特征选择(如何解释结果)?

2024-03-28 11:33:25 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有一个数据集,我想选择与预测结果相对应的特征。我实施了一些功能排名测试,结果如下:

enter image description here

对于预测模型,我选择了具有最佳“平均”值的特征。你知道吗

X = oil_10[['Sidetrack Code','Well Type Code','Well Status  
Code','Producing Formation','Water Produced, bbl','County']]

以下是具有“最佳选择特征”的预测模型结果:

RandomForestRegressor
0.390502562474

以下是所有数据集特征的预测模型的结果,无需任何选择:

RandomForestRegressor
0.741878611892

如何利用特征排序结果实现最佳预测结果?你知道吗


Tags: 数据模型功能typestatuscode特征oil
1条回答
网友
1楼 · 发布于 2024-03-28 11:33:25

我试着用这种方法来解决我的问题: 我刚刚删除了最不重要的特征(其平均重要性值小于0.15),准确率保持在75%不变,但现在预测模型的工作速度要快得多。你知道吗

相关问题 更多 >