英语字母数字识别的最佳模型 - 问答 - Python中文网

英语字母数字识别的最佳模型

2024-05-16 04:15:50 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我有一个相当大的数据集（超过50万张50x50张图片），总共包含62个类。图像代表英文字母和数字（全部手写）。每个班级至少有2000个样本。在

我一直在训练卷积神经网络用张量流来识别这些图像。在

问题：在快速（大约200次训练迭代）非常接近局部最优（损失值如0.01）之后，我的分类器在测试集上的准确率仍停留在82%左右。在

问题：我怎样才能更准确？我和CNN有什么不对吗？另外，尝试支持向量机值得吗？我根据我下面的CNN模型给出详细信息。在

随机数据集条目： 问题2：除了旋转模式，我的预处理方法是否良好？我是要拉伸图案还是让它保持原样：使用带有冗余白色像素的左右边距区域。在

详细信息和超参数：

Tensorflow优化器：AdamOptimizer
学习率α：0.001
辍学：1.0（无辍学）
小批量大小：1500
卷积层数：2
池层数：2
完全连接的层：1
步幅：2像素
过滤器大小：5像素
试验/列车组比例：0.2/0.8

注意：纹身不是骨骼，它们有它们原来的宽度。图像是二进制的，模式值为0，背景为1。在

更新

下面是我的代码负责培训和一个很小的图像子集：
https://drive.google.com/open?id=0B5kuwbyrKVqnTm1PMGZGMUxUNFU

由于我的网速慢，我无法上传足够的数据。
但是，您可以绘制这些图像，以确定是否需要进一步的预处理。在

Tags：数据图像模式图片详细信息代表数字像素

1条回答

网友

1楼 · 发布于 2024-05-16 04:15:50

看起来太合适了。你的损失是0.01，测试集的准确率在82%左右，损失大于0.01（准确率99%约损失0.04）。在

这是一个具体的问题。我认为：

降低学习率，如1e-4
加上辍学，辍学将有助于减少过度适应
减小滤波器尺寸，我觉得5x5对于50x50 pic来说太大了，你可以再增加一个卷积层
你的激活方法，relu是一个很好的方法来减少过度适应

没有测试，这只是建议，顺便说一句，如果你愿意，给一个数据集的网址，我想训练它。；—）

相关问题更多 >

编程相关推荐

热门问题

热门文章