Tesseract OCR用于数字分类的效果较差

2024-04-20 08:51:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在进行一项图像分类任务,我正在使用Tesseract OCR进行数字分类。在

我的主要问题是从OCR接收到的单个数字的结果非常差。在

在网上阅读了大量关于提高Tesseract性能的文章后,我使用OpenCV对图像进行了预处理,使用的一般方案如下:

  1. 寻找等高线
  2. 边界框
  3. 裁剪到方框以获得个位数
  4. 二值图像的阈值分割
  5. 通过添加白色背景填充图像
  6. 模糊。在

我得到了一些我相当满意的东西,例如:

我用以下方式给Tesseract打电话,强调我期望的是个位数:

tesseract input.jpg output.txt - psm 10 digits

我以为Tesseract肯定能正确识别它,但它返回了“”。在

有人有进一步改进的想法吗?我想我可以训练Tesseract来适应这个特定的字体,但是由于我要处理不同的字体,所以我希望有更好的方法。在


Tags: 图像文章方案字体分类数字性能opencv
2条回答

什么版本的Tesseract?它适用于我(注意:在“-”和“psm”之间不能有空格)。在

$ tesseract ~/Downloads/6digit.jpg stdout -psm 10 digits
6

$ tesseract -v
tesseract 3.05.00dev
 leptonica-1.71
  libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

最后,根据@micka的评论,我做的是把所有的单个字符组合成一个图像,然后将该图像发送给OCR。由于一些我还不清楚的原因,它确实改善了结果。在

相关问题 更多 >