有没有简单的方法可以对图像进行OCR?
这个内容基本上只使用了“Times New Roman”这种字体,并且是一个小矩形,大小是220x86。里面的文字都是一样的大小,没有奇怪的字符,只有字母A到Z和小写字母a到z,还有数字0到9,共有八种不同的颜色(每行一种颜色)。
有没有什么简单的方法可以做到这一点呢?
1 个回答
1
最好的开源OCR(光学字符识别)工具是 Tesseract。这个工具可以进行训练,所以你可以专门针对“Times New Roman”这种字体,虽然它已经有针对类似文本的训练数据了。你可以通过使用 os.popen()
来在Python中使用它。