Python/C++/Java:有没有库可以识别字符并告诉我它们在图像中的位置?

2 投票
3 回答
1570 浏览
提问于 2025-04-17 07:01

我查了一下PyTesser和Tesseract,发现它们在我输入一张图片后,只会给我一个字符串。

不过,我其实想要的是每个识别出来的字符的坐标或者边界矩形。虽然字符串对我以后可能有用,但现在我并不需要它。

假设PyTesser和Tesseract不提供这个功能,有没有其他免费的工具(比如,不是Matlab之类的)可以做到这一点呢?

3 个回答

0

也许你可以试试“ocropus”:

http://code.google.com/p/ocropus/

1

看看最近在tesseract谷歌小组上发布的一个类似问题:http://groups.google.com/group/tesseract-ocr/browse_thread/thread/70ad57cb37edabe0/

3

根据这个邮件列表的讨论,你可以用Tesseract来做到这一点。不过,我不知道有没有Python的工具可以让你获取到那些数据。

撰写回答