决策树Sklearn-树的深度和精度

2024-04-27 22:07:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用sklearn将决策树应用于数据集

在Sklearn中,有一个参数用于选择树的深度- dtree=决策树助手(最大深度=10)。

我的问题是max_depth参数对模型有什么帮助。 高/低最大深度如何帮助更准确地预测测试数据?


Tags: 数据决策树参数助手sklearnmaxdepth测试数据
1条回答
网友
1楼 · 发布于 2024-04-27 22:07:06

max_depth就是这个名字的意思:允许树生长到的最大深度。你允许的越深,你的模型就越复杂。

对于训练失误,很容易看出会发生什么。如果增加max_depth,则训练错误始终会下降(或至少不会上升)。

对于测试错误,它变得不那么明显。如果将max_depth设置得太高,则决策树可能会简单地过拟合训练数据,而不会像我们希望的那样捕获有用的模式;这将导致测试错误增加。但是,如果将它设置得太低,也不太好;那么您可能会使决策树的灵活性太小,无法捕获训练数据中的模式和交互。这也会导致测试错误增加。

在太高和太低之间有一个很好的黄金点。通常,建模者会将max_depth视为一个超参数,并使用某种带有交叉验证的网格/随机搜索来为max_depth找到一个好的数字。

相关问题 更多 >