英语字母数字识别的最佳模型

2024-05-16 04:15:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个相当大的数据集(超过50万张50x50张图片),总共包含62个类。图像代表英文字母和数字(全部手写)。每个班级至少有2000个样本。在

我一直在训练卷积神经网络用张量流来识别这些图像。在

问题:在快速(大约200次训练迭代)非常接近局部最优(损失值如0.01)之后,我的分类器在测试集上的准确率仍停留在82%左右。在

问题:我怎样才能更准确?我和CNN有什么不对吗?另外,尝试支持向量机值得吗?我根据我下面的CNN模型给出详细信息。在

随机数据集条目: enter image description here问题2:除了旋转模式,我的预处理方法是否良好?我是要拉伸图案还是让它保持原样:使用带有冗余白色像素的左右边距区域。在

详细信息和超参数

  • Tensorflow优化器:AdamOptimizer
  • 学习率α:0.001
  • 辍学:1.0(无辍学)
  • 小批量大小:1500
  • 卷积层数:2
  • 池层数:2
  • 完全连接的层:1
  • 步幅:2像素
  • 过滤器大小:5像素
  • 试验/列车组比例:0.2/0.8

注意:纹身不是骨骼,它们有它们原来的宽度。图像是二进制的,模式值为0,背景为1。在

更新

下面是我的代码负责培训和一个很小的图像子集
https://drive.google.com/open?id=0B5kuwbyrKVqnTm1PMGZGMUxUNFU

由于我的网速慢,我无法上传足够的数据。
但是,您可以绘制这些图像,以确定是否需要进一步的预处理。在


Tags: 数据图像模式图片详细信息代表数字像素
1条回答
网友
1楼 · 发布于 2024-05-16 04:15:50

看起来太合适了。你的损失是0.01,测试集的准确率在82%左右,损失大于0.01(准确率99%约损失0.04)。在

这是一个具体的问题。我认为:

  • 降低学习率,如1e-4
  • 加上辍学,辍学将有助于减少过度适应
  • 减小滤波器尺寸,我觉得5x5对于50x50 pic来说太大了,你可以再增加一个卷积层
  • 你的激活方法,relu是一个很好的方法来减少过度适应

没有测试,这只是建议,顺便说一句,如果你愿意,给一个数据集的网址,我想训练它。;—)

相关问题 更多 >