Tesseract输出更改、添加和删除非常清晰图像中的数字

2024-05-23 13:50:53 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在开发一个程序，该程序使用网络摄像头，通过pytesseract（长话短说）读取屏幕上不断变化的数字。它获取整个屏幕的图像，然后使用存储在名为“roi”列表中的预定坐标剪切出需要记录的每个数字（共23个）。还有其他一些步骤，但这是最重要的部分。目前，它正在不断地添加、删除和更改数字，但并不是始终如一地添加、删除和更改数字。以下是一些例子：

它错误地将其解读为“32.0”

它正确地将其解读为“52.0”

它错误地将其解读为“39.3”

它错误地将其解读为“2499.1”

这些图像已经使用OpenCV进行了处理，roi集中的所有图像都是这样的。基于其他答案，我对其进行了二值化，尝试清理边缘，并在图像周围添加了白色边框（请参见代码）

该程序每30秒读取一次屏幕，有时读取正确，有时读取错误。很多时候，它喜欢把5s变成3s，把3s变成5s，把5s变成9s。有时，它只是遗漏或添加了一些数字。下面是我处理图像的代码

pytesseract.pytesseract.tesseract_cmd = #tesseract file path
scale = 1.4
img = cv2.imread(#image file path#)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img = cv2.rotate(img, cv2.ROTATE_180)
width = int(img.shape[1] / scale)
height = int(img.shape[0] / scale)
dim = (width, height)
img = cv2.resize(img, dim, interpolation=cv2.INTER_AREA)                                    
cv2.destroyAllWindows()

myData = []
cong = r'--psm 6 -c tessedit_char_whitelist=+0123456789.-'

for x,r in enumerate(roi):                                                                 
    imgCrop = img[r[0][1]:r[1][1], r[0][0]:r[1][0]]        
    scalebig = 0.2
    wid = int(imgCrop.shape[1] / scalebig)
    hei = int(imgCrop.shape[0] / scalebig)
    newdims = (wid, hei)
    imgCrop = cv2.resize(imgCrop, newdims)

    imgCrop = cv2.threshold(imgCrop,155,255,cv2.THRESH_BINARY)[1]

    kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))                              
    imgCrop = cv2.morphologyEx(imgCrop, cv2.MORPH_CLOSE, kernel2, iterations=2)

    value = [255,255,255]
    imgCrop = cv2.copyMakeBorder(imgCrop, 10, 10, 10, 10, cv2.BORDER_CONSTANT, None, value = value)

    datapoint = pytesseract.image_to_string(imgCrop, lang='eng', config=cong)
    myData.append(datapoint)

输出是我上面链接的图片

我已经对它进行了微调，但我有一台Windows机器，似乎找不到好的教程。我不是一名程序员，我花了2个月的时间自学Python来做这件事，但是Tesseract的机器学习方面让我感到困惑，我不知道还有什么其他方法来修复明显不一致的读数。如果你需要任何进一步的信息，请询问，我很乐意告诉你

编辑：添加了更多错误读取的图像以供参考

Tags：图像程序 img 屏幕 value 错误数字 cv2

1条回答

网友

1楼 · 发布于 2024-05-23 13:50:53

确保使用正确的图像格式（jpeg是OCR的错误格式）
对于tesseract LSTM引擎，请确保字母大小不大于35点

使用tesseract best_tessdata，我得到了以下结果：

tesseract 593_small.png -
59.3

tesseract 520_small.png -
52.0

tesseract 2491_small.png -
249.1

Tesseract输出更改、添加和删除非常清晰图像中的数字

相关问题更多 >

编程相关推荐

热门问题

热门文章

Tesseract输出更改、添加和删除非常清晰图像中的数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >