我需要从一些图像中读取文本,图像清晰且噪音很低。 所以我最初的想法是应该很容易获取文本。(我知之甚少)
我测试了一些python库,但没有成功(pytesser),它们可能会得到10%的正确率。 我转向了Googles tesseract-occ但它仍然远远不够好。
下面是一个例子:
结果如下:
nemnamons
Ill
w_on
lhggerllo
' 59
' as
\M_P2ma\
vuu uu
Cafllode omer
Mom | Dyna
Mom | Dyna
lnggerllo
2vMnne= Tr2rspnn| Factory (Hexmy;
lalgeflll Uxzlconflg
w_o«
w_o«
cammem
我做错什么了?还是OCR识别真的这么差?
为了得到更好的效果,你需要对图像进行预处理,比如去除噪声。稍后,您可以使用诸如
pytesseract
之类的库从图像中获取文本:相关问题 更多 >
编程相关推荐