机器学习中的集成技术问题

网友

1楼 · 编辑于 2024-04-26 23:23:10

集合中的想法是，一组弱预测因子比一个强预测因子表现更好。因此，如果我们用不同的预测结果训练不同的模型，并使用多数规则作为我们集成的最终结果，这个结果比仅仅训练一个模型要好。例如，假设数据由两种不同的模式组成，一种是线性模式，另一种是二次模式。然后使用单个分类器可能会过拟合或产生不准确的结果。你可以阅读this tutorial来了解更多关于合奏、打包和增强的知识。你知道吗

网友

2楼 · 编辑于 2024-04-26 23:23:10

假设红色和蓝色是你能找到的最好的模型。你知道吗

一个在1区效果更好，另一个在2区效果更好。你知道吗

现在您还将训练分类器来预测要使用哪个模型，即，您将尝试学习这两个区域。你知道吗

在外面做验证。如果让两个内部模型访问元模型看不到的数据，则可能会过度拟合。你知道吗

网友

3楼 · 编辑于 2024-04-26 23:23:10

1）“但是我还是不能理解，为什么不训练所有的训练数据就可以避免这个问题呢？”-我们将保留这些数据用于验证目的，就像我们在K-fold中所做的那样

2）“那么我是否也应该根据所有训练数据训练M-base学习者，以便输入预测？”-如果你给所有的学习者提供相同的数据，那么所有学习者的输出都是相同的，创建这些数据是没有用的。因此，我们将为每个学员提供一部分数据。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章