我试图从游戏截图中提取数字
我试图提取:
98
3430
5/10
from PIL import Image
import pytesseract
image="D:/img/New folder (2)/1.png"
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'
text = pytesseract.image_to_string(Image.open(image),lang='eng',config='--psm 5')
print(text)
输出乱七八糟
‘t hl) keteeeees
ek pSlaerenen
JU) pgrenmnreserenny
Rates B
d dali eas. 5
cle aM (Sores
|, S| pgranmrerererecons
a cee 3
pea 3
oS :
(geo eenee
ey
=
es A
如果文本被设计所包围,tesseract会遭受很多损失
代替tesseract,尝试在opencv中使用findcontours(稍微模糊、膨胀后)
您将得到边界框,然后它可能也会覆盖该文本
好的,所以我试着把它变成灰度,反向对比或者使用不同的树状结构,但这一切似乎都是相当不准确的。 问题似乎在于倾斜和较小的数字。你没有hiher的图像吗? 我能得到的最准确的代码是以下代码
否则,我建议将其中一种方法命名为described in the similar question 或在this one.
相关问题 更多 >
编程相关推荐