擅长:python、mysql、java
<p>两者可以互补。如果你读了OpenCV上的文章:
<a href="https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf" rel="nofollow noreferrer">https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf</a></p>
<p>该报告强调,“由于惠普已经独立开发了用于产品的页面布局分析技术(因此没有发布用于开源的技术),Tesseract从不需要自己的页面布局分析。因此,Tesseract假定其输入为二进制图像,并定义了可选的多边形文本区域。”</p>
<p>这类任务可以由OpenCV执行,并将生成的图像传递给Tesseract。您可以在Git repo中找到此类代码的示例:<a href="https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples" rel="nofollow noreferrer">https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples</a>
示例使用Tesseract API进行图像到文本的转换。</p>