擅长:python、mysql、java
<p>似乎在走了12k步之后,模型开始过度拟合。训练损失进一步减小,验证损失(泛化误差)又缓慢增加。在这之后,训练模型只会使情况变得更糟。在</p>
<p>在下图中,您处于过拟合区域。在</p>
<p><a href="https://i.stack.imgur.com/1r7BH.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/1r7BH.png" alt=""/></a></p>
<p>(来自<a href="https://www.deeplearningbook.org" rel="nofollow noreferrer">www.deeplearningbook.org</a>)</p>
<p>您可能希望通过增加正则化来降低模型对训练数据过度拟合的能力。例如,L2权重正则化或<a href="https://medium.com/@erikhallstrm/using-the-dropout-api-in-tensorflow-2b2e6561dfeb" rel="nofollow noreferrer">dropout</a>。在</p>
<p>至于振荡。考虑到您的批量为100,它们可能是天然的。在</p>