识别带有线性字母噪音的手写字母

2024-04-25 17:51:45 发布

您现在位置:Python中文网/ 问答频道 /正文

识别手写字母时出现问题。你知道吗

因此,以下是输入图像:

首先:

enter image description here

第二:

enter image description here

第三:

enter image description here

第四:

enter image description here

我使用tesseract识别字母:

tesseract t4.png s -l wni_l --psm 6

其中wni\ l是自训练数据:

enter link description here

结果如下:

第一名:AB

第二名:AB

第三名:AB

第四名:BDB

我的问题是,不管怎样,有没有什么可以忽略直体或涂改的字母?你知道吗

可能需要通过opencv或其他机器学习技能(例如tensorflow)优化输入图像?你知道吗

所以,除了第一张图片,我需要得到B,而不是那些错误的结果。你知道吗

或者通过将这些人加入到阴性案例中来强制训练(如果使用支持向量机)?你知道吗

环境:

Python 2.7.10版

特塞特:4.0.0

Opencv:3.2.0版

任何建议都非常感谢。你知道吗

谢谢。你知道吗

卫斯理


Tags: 数据图像hereabpng字母linkdescription