2024-04-27 22:07:06 发布
网友
我使用sklearn将决策树应用于数据集
在Sklearn中,有一个参数用于选择树的深度- dtree=决策树助手(最大深度=10)。
我的问题是max_depth参数对模型有什么帮助。 高/低最大深度如何帮助更准确地预测测试数据?
max_depth就是这个名字的意思:允许树生长到的最大深度。你允许的越深,你的模型就越复杂。
max_depth
对于训练失误,很容易看出会发生什么。如果增加max_depth,则训练错误始终会下降(或至少不会上升)。
对于测试错误,它变得不那么明显。如果将max_depth设置得太高,则决策树可能会简单地过拟合训练数据,而不会像我们希望的那样捕获有用的模式;这将导致测试错误增加。但是,如果将它设置得太低,也不太好;那么您可能会使决策树的灵活性太小,无法捕获训练数据中的模式和交互。这也会导致测试错误增加。
在太高和太低之间有一个很好的黄金点。通常,建模者会将max_depth视为一个超参数,并使用某种带有交叉验证的网格/随机搜索来为max_depth找到一个好的数字。
max_depth
就是这个名字的意思:允许树生长到的最大深度。你允许的越深,你的模型就越复杂。对于训练失误,很容易看出会发生什么。如果增加
max_depth
,则训练错误始终会下降(或至少不会上升)。对于测试错误,它变得不那么明显。如果将
max_depth
设置得太高,则决策树可能会简单地过拟合训练数据,而不会像我们希望的那样捕获有用的模式;这将导致测试错误增加。但是,如果将它设置得太低,也不太好;那么您可能会使决策树的灵活性太小,无法捕获训练数据中的模式和交互。这也会导致测试错误增加。在太高和太低之间有一个很好的黄金点。通常,建模者会将
max_depth
视为一个超参数,并使用某种带有交叉验证的网格/随机搜索来为max_depth
找到一个好的数字。相关问题 更多 >
编程相关推荐