手写文本识别中的数字和文字分类

2024-06-07 23:52:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用神经网络进行手写文本识别, 我想我用过这个

  • 用于图像处理的opencv
  • 页面分割和文本框提取
  • 分词(或任何关于更准确分词/屏蔽文本的建议)

我有一个带有姓名、年龄和出生日期文本框的表格 name字段的结果良好(能够识别),但对于DOB和age,它无法将其完全识别为数字。一些数字(如“1”和“0”)被识别为“i”和“o”

我如何将其分类为单词和数字,或者我可以仅使用任何其他数字模型(目前我已使用IAM数据集单词训练NN)或任何建议

example pic

result : --i-16-16-
result : -i-i6-86-

Tags: 文本数字神经网络页面result单词opencv图像处理
1条回答
网友
1楼 · 发布于 2024-06-07 23:52:04

您可以训练另一个NN,因为数字识别不是一项相对计算密集的任务

或者,如果文档具有固定格式,则您知道年龄和出生日期在哪里。在这种情况下,当对输出层设置阈值以决定输出时,只对表示数字的神经元进行设置

例如,假设您有5个数字和5个字母。经过训练的NN的输出层给出,[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06]

在其上执行softmax以获得概率解释。然后选择一个输出。相反,只对代表数字的神经元执行softmax。你也可以把它看作先验概率为零

这里i1具有更高的激活率。但在执行softmax时,您只选择代表数字的神经元。因此您得到1

相关问题 更多 >

    热门问题