手写文本识别中的数字和文字分类 - 问答 - Python中文网

手写文本识别中的数字和文字分类

2024-06-07 23:52:04 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在使用神经网络进行手写文本识别，我想我用过这个

用于图像处理的opencv
页面分割和文本框提取
分词（或任何关于更准确分词/屏蔽文本的建议）

我有一个带有姓名、年龄和出生日期文本框的表格 name字段的结果良好（能够识别），但对于DOB和age，它无法将其完全识别为数字。一些数字（如“1”和“0”）被识别为“i”和“o”

我如何将其分类为单词和数字，或者我可以仅使用任何其他数字模型（目前我已使用IAM数据集单词训练NN）或任何建议

result : --i-16-16-
result : -i-i6-86-

Tags：文本数字神经网络页面 result 单词 opencv 图像处理

1条回答

网友

1楼 · 发布于 2024-06-07 23:52:04

您可以训练另一个NN，因为数字识别不是一项相对计算密集的任务

或者，如果文档具有固定格式，则您知道年龄和出生日期在哪里。在这种情况下，当对输出层设置阈值以决定输出时，只对表示数字的神经元进行设置

例如，假设您有5个数字和5个字母。经过训练的NN的输出层给出，[0.38, 0.006, 0.01, 0.004, 0.1, 0.03, 0.009, 0.4, 0.001, 0.06]

在其上执行softmax以获得概率解释。然后选择一个输出。相反，只对代表数字的神经元执行softmax。你也可以把它看作先验概率为零

这里i比1具有更高的激活率。但在执行softmax时，您只选择代表数字的神经元。因此您得到1

相关问题更多 >

编程相关推荐

热门问题

热门文章