在Mac OS X上安装tesseract/pytesser
我正在尝试在osx 10.9上安装这个(还有pytesser),并且我把anaconda设为默认的python。我在网上查了很多资料,但找不到任何有效的教程,因为它们似乎都过时了(比如,homebrew没有leptonica的安装公式)。我可能已经花了将近一周的时间来安装这个,但完全没有成功。
有没有人最近成功安装过这个?你是怎么做到的?
谢谢
编辑:奇怪的是,leptonica的brew突然可以用了。不过我遇到了一个比较奇怪的错误。
brew install tesseract
==> Downloading https://bitbucket.org/3togo/python-tesseract/downloads/tesseract
Already downloaded: /Library/Caches/Homebrew/tesseract-3.03-rc1.tar.gz
==> ./configure --prefix=/usr/local/Cellar/tesseract/3.03-rc1
checking for leptonica... yes
checking for pixCreate in -llept... yes
checking leptonica version >= 1.70... configure: error: in `/private/tmp/tesseract- 19Ol/tesseract-3.03':
configure: error: leptonica 1.70 or higher is required
See `config.log' for more details
READ THIS: https://github.com/Homebrew/homebrew/wiki/troubleshooting
也就是说,它在注册安装,但仍然无法正常工作。我会按照指示检查配置文件。
编辑2:
在尝试在python中导入这个库时,我得到了这个错误:
import tesseract
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "//anaconda/lib/python2.7/site-packages/python-tesseract_0.8-3.0-py2.7_macosx-10.9- intel.egg/tesseract.py", line 28, in <module>
_tesseract = swig_import_helper()
File "//anaconda/lib/python2.7/site-packages/python-tesseract_0.8-3.0-py2.7_macosx-10.9-intel.egg/tesseract.py", line 24, in swig_import_helper
_mod = imp.load_module('_tesseract', fp, pathname, description)
ImportError: dlopen(//anaconda/lib/python2.7/site-packages/python-tesseract_0.8-3.0- py2.7_macosx-10.9-intel.egg/_tesseract.so, 2): Library not loaded: /usr/local/lib/libtesseract.3.dylib
引用自://anaconda/lib/python2.7/site-packages/python-tesseract_0.8-3.0-py2.7_macosx-10.9-intel.egg/_tesseract.so
原因:找不到图像
老实说,对于这些幕后安装的事情,我完全是个新手,甚至为了能做到这一点,我都得在网上查了很多资料。如果有谁能提供一些明显的解决办法,我会非常感激,因为我感觉自己已经在网上找了很多解决方案,快要考虑放弃这个库,自己写一个ocr库了——这绝对不是我想做的工作。另外,如果有人知道其他不错的python ocr库,支持和安装维护都不错的话,我也很想了解(根据我的搜索,我怀疑tesseract是最知名的,这也是为什么安装这么麻烦让我感到沮丧)。
如果有勇士愿意帮我解决这个问题,我会很乐意提供更多关于我系统的信息。
谢谢!
2 个回答
我刚刚在我的Mac上用brew安装了tesseract 3.02,没遇到什么问题(系统是osx 10.9)。如果你不需要3.03版本,可以试试安装3.02。关于如何用brew安装不同版本的说明,可以参考这个链接:Homebrew安装特定版本的公式?
不过,根据你的日志来看,brew的安装没有成功,所以tesseract无法被导入。brew会下载源代码,运行配置,然后进行安装。配置这一步失败了,因为你需要leptonica 1.70。通常情况下,brew会自动检测到这个依赖并为你安装leptonica 1.70。
你可以尝试自己安装leptonica,链接在这里:http://www.leptonica.com/download.html。关于如何构建的说明可以查看这个链接:http://www.leptonica.com/source/README.html