我正在进行一项图像分类任务,我正在使用Tesseract OCR进行数字分类。在
我的主要问题是从OCR接收到的单个数字的结果非常差。在
在网上阅读了大量关于提高Tesseract性能的文章后,我使用OpenCV对图像进行了预处理,使用的一般方案如下:
我得到了一些我相当满意的东西,例如:
我用以下方式给Tesseract打电话,强调我期望的是个位数:
tesseract input.jpg output.txt - psm 10 digits
我以为Tesseract肯定能正确识别它,但它返回了“”。在
有人有进一步改进的想法吗?我想我可以训练Tesseract来适应这个特定的字体,但是由于我要处理不同的字体,所以我希望有更好的方法。在
什么版本的Tesseract?它适用于我(注意:在“-”和“psm”之间不能有空格)。在
最后,根据@micka的评论,我做的是把所有的单个字符组合成一个图像,然后将该图像发送给OCR。由于一些我还不清楚的原因,它确实改善了结果。在
相关问题 更多 >
编程相关推荐