我正在用Python中的Tesseract OCR准备半导体晶圆ID,
但是它不是很成功,而且-c tessedit_char_whitelist=0123456789XL config
也不起作用。读出芯片ID为:po4>1
。你知道吗
我的OG形象 my image before process
我的部分代码如下:
# identify
optCode = pytesseract.image_to_string("c:/opencv/ID_fine_out22.jpg",lang="eng", config=' --psm 6 -c tessedit_char_whitelist=0123456789XL')
# print chip iD
print("ChipID:", optCode)
有什么改进OCR的方法吗?也要尽量只读数字。你知道吗
我认为ML也是一种方法,因为我有大量的样本图像。你知道吗
对于我自己,我用
pytesseract
和opencv
库中的一些技术编写了一些肮脏的脚本。您可以在这里选择不同的参数并查看结果。 例如,我有一个名为softserve.png
的图像:假设有
ocr.py
,代码如下:如果我只是使用普通的OCR而不使用任何东西(例如
pytesseract.image_tostring()
):我会收到这样的短信:
这是一个非常糟糕的结果,不是吗?你知道吗
但是在玩了
resize
和thresh
之后,您可以得到一个更好的输出:在两个打开的窗口中查看OCR前图像的外观:
输出:
您还可以应用
morph
和blur
。您可以从opencv
docs阅读有关blur、thresholding和morphological transformations的更多信息。我希望,你会发现这些信息对你的工作有用相关问题 更多 >
编程相关推荐