我正在使用神经网络进行手写文本识别,
我想我用过这个
- 用于图像处理的opencv
- 页面分割和文本框提取
- 分词(或任何关于更准确分词/屏蔽文本的建议)
我有一个带有姓名、年龄和出生日期文本框的表格
name字段的结果良好(能够识别),但对于DOB和age,它无法将其完全识别为数字。一些数字(如“1”和“0”)被识别为“i”和“o”
我如何将其分类为单词和数字,或者我可以仅使用任何其他数字模型(目前我已使用IAM数据集单词训练NN)或任何建议
result : --i-16-16-
result : -i-i6-86-
Tags:
您可以训练另一个NN,因为数字识别不是一项相对计算密集的任务
或者,如果文档具有固定格式,则您知道年龄和出生日期在哪里。在这种情况下,当对输出层设置阈值以决定输出时,只对表示数字的神经元进行设置
例如,假设您有5个数字和5个字母。经过训练的NN的输出层给出,
[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06]
在其上执行softmax以获得概率解释。然后选择一个输出。相反,只对代表数字的神经元执行softmax。你也可以把它看作先验概率为零
这里
i
比1
具有更高的激活率。但在执行softmax时,您只选择代表数字的神经元。因此您得到1
相关问题 更多 >
编程相关推荐