CNN准确度冻结

2024-06-16 10:53:08 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我正在训练一个CNN网络从输入图像中检测某些特征。结构如下:

输入图像->;Conv2D->;Relu->;Dense->;Softmax->;结果

数据集包含3个类中的180个黑白图像,每个类正好有60个图像。在

我的问题是验证准确度和训练准确度在6-7个周期后都没有变化,如下图所示:

enter image description here

我试着在谷歌上搜索解决方案,但到目前为止没有结果。一开始我认为我的模型太适合了,因为它不再“学习”,培训损失不断减少,而验证损失却没有。因此,我尝试添加学习速率衰减、Nesterov动量、增加批次大小以减少过度拟合,但它们并没有改变太多(总体准确度确实从0.90提高到0.92),而且我的准确度每次都精确地停留在1.00、0.88和0.87(之前是1.00、0.85和0.85)。在

我想识别的功能相当简单,我需要在一个控制回路中使用结果,所以我想要一个重量轻的模型,如果可能的话,精度至少达到95%。你们对改进这个模型有什么想法吗?在


Tags: 数据模型图像gt网络特征结构cnn
1条回答
网友
1楼 · 发布于 2024-06-16 10:53:08

你的模特太合身了。训练损失接近于零(训练准确率已经达到100%),而验证损失远高于训练损失。一个理想的模型将减少训练和验证损失。您还没有提供任何代码;所以假设您的模型没有错误,我建议使用正则化技术,比如dropout、weight decay(L2)和批处理规范化。在

相关问题 更多 >