pytesseract找不到指定的文件

2024-05-23 19:57:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我的代码是直截了当的,如下所示:

import pytesseract
from PIL import Image

img = Image.open('C:/temp/foo.jpg')
img.load()
i = pytesseract.image_to_string(img)

我得到的错误响应是:

Traceback (most recent call last):
  File "img.py", line 6, in <module>
    i = pytesseract.image_to_string(img)
  File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 161, in image_to
_string
  File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 94, in run_tesse
ract
  File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 710, in __init__
    errread, errwrite)
  File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 958, in _execute_child
    startupinfo)
WindowsError: [Error 2] The system cannot find the file specified

任何指导都会很棒。

将tesseract添加到我的路径变量有助于: C:\Program Files (x86)\Tesseract-OCR

但是当试图运行pytesseract块时,代码现在崩溃了。


Tags: to代码inpyimageimportbuildimg
1条回答
网友
1楼 · 发布于 2024-05-23 19:57:06

只是碰到同样的错误,决定回答这个问题-这可能有助于节省时间。。。

首先,确保有installed/copied Tesseract-OCR executables

Windows在PATH环境变量中指定的目录中找不到可执行文件tesseract。因此,要么确保包含tesseract的目录在您的PATH变量中,要么按如下方式覆盖Python脚本中的tesseract_cmd变量(请改为输入路径):

import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

除此之外,请确保将TESSDATA_PREFIXWindows环境变量设置为包含tessdata目录的目录。例如:

TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR

如果tessdata位置是:C:\Program Files (x86)\Tesseract-OCR\tessdata

相关问题 更多 >