张量流CNN损失函数在张力板上下摆动，如何去除？

2条回答

网友

1楼 · 编辑于 2024-04-28 22:26:02

似乎在走了12k步之后，模型开始过度拟合。训练损失进一步减小，验证损失（泛化误差）又缓慢增加。在这之后，训练模型只会使情况变得更糟。在

在下图中，您处于过拟合区域。在

您可能希望通过增加正则化来降低模型对训练数据过度拟合的能力。例如，L2权重正则化或dropout。在

至于振荡。考虑到您的批量为100，它们可能是天然的。在

网友

2楼 · 编辑于 2024-04-28 22:26:02

在一个好的模型中，您将希望您的损失函数的图形向下显示为验证集。下降趋势表明，您的模型正在泛化，以学习以前看不到的示例。机器学习的一般目标是能够使用采样数据点学习一些模型参数，这些数据点捕捉到学习问题，并且可以对样本外的例子进行预测。在

对于训练集，损失值的下降趋势表明模型正在从提供的训练示例中学习对目标输出的合理估计。您通常也希望看到这个向下的图表；否则，这将意味着您的模型不符合训练集，并且根据经验保证在验证集上不会做得很好。在