Tesseract OCR用于数字分类的效果较差 - 问答 - Python中文网

Tesseract OCR用于数字分类的效果较差

2024-04-20 08:51:22 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在进行一项图像分类任务，我正在使用Tesseract OCR进行数字分类。在

我的主要问题是从OCR接收到的单个数字的结果非常差。在

在网上阅读了大量关于提高Tesseract性能的文章后，我使用OpenCV对图像进行了预处理，使用的一般方案如下：

寻找等高线
边界框
裁剪到方框以获得个位数
二值图像的阈值分割
通过添加白色背景填充图像
模糊。在

我得到了一些我相当满意的东西，例如：

我用以下方式给Tesseract打电话，强调我期望的是个位数：

tesseract input.jpg output.txt - psm 10 digits

我以为Tesseract肯定能正确识别它，但它返回了“”。在

有人有进一步改进的想法吗？我想我可以训练Tesseract来适应这个特定的字体，但是由于我要处理不同的字体，所以我希望有更好的方法。在

Tags：图像文章方案字体分类数字性能 opencv

2条回答

网友

1楼 · 编辑于 2024-04-20 08:51:22

什么版本的Tesseract？它适用于我（注意：在“-”和“psm”之间不能有空格）。在

$ tesseract ~/Downloads/6digit.jpg stdout -psm 10 digits
6

$ tesseract -v
tesseract 3.05.00dev
 leptonica-1.71
  libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

网友

2楼 · 编辑于 2024-04-20 08:51:22

最后，根据@micka的评论，我做的是把所有的单个字符组合成一个图像，然后将该图像发送给OCR。由于一些我还不清楚的原因，它确实改善了结果。在

相关问题更多 >

编程相关推荐

热门问题

热门文章