使用用户词和用户模式训练tesseract,但同时保持系统字典

2024-04-25 23:59:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试用特定的用户词和用户模式来训练tesseract,并修改了TesserData文件夹中的相应文件。然而,它似乎根本不起作用。有没有一种方法可以用Python(而不是命令行)训练tesseract使用自己的用户词和用户模式,同时保留系统字典?你知道吗

下面是我用来训练tesseract的代码。它没有给出任何错误,但它似乎没有采取用户的话和用户模式,这是在tessdata文件夹中。你知道吗

from tesserocr import PyTessBaseAPI
with PyTessBaseAPI(path='C:/Tesseract-OCR/tessdata', lang='eng') as api:

    api.SetVariable("user_words_suffix","user-words")
    api.SetVariable("user_pattern_suffix","user-pattern")

Tags: 文件方法用户文件夹api模式suffixpattern