一个简单的带opencv的ocr
simple-opencv-ocr的Python项目详细描述
一个简单的pythonic ocr引擎,使用opencv和numpy。
最初的灵感来自 http://stackoverflow.com/questions/9413216/simple-digit-recognition-ocr-in-opencv-python
基本概念
####分段
为了在图像上执行ocr,必须执行几个步骤 对源映像执行。分割是 识别代表字符的图像区域。
此项目使用矩形来建模线段。
####带分类问题的监督学习
[分类问题][]包括确定属于哪一类 观察属于(即:包含哪个特定字符 在一段中)。
[监督学习][]是“教”机器的一种方式。基本上,一个 算法是trained到examples(即:这个特殊的 段包含字符f。经过训练,机器 应能将其获得的知识应用于新数据。
本项目中使用的[k-nn算法是最简单的算法之一 分类算法。
####接地
创建具有已分类字符的示例图像,用于 培训目的。 见[基本事实][]。
[分类问题]:https://en.wikipedia.org/wiki/Statistical_classification [监督学习]:https://en.wikipedia.org/wiki/Supervised_learning [K-NN算法]:https://en.wikipedia.org/wiki/K-nearest_neighbors_classification [基本事实]:https://en.wikipedia.org/wiki/Ground_truth
如何理解本项目
不幸的是,目前文档有点少(i 欣然接受捐款)。 该项目结构良好,大多数类和函数都具有 docstrings,所以这可能是一个很好的开始。
如果你需要任何帮助,请随时与我联系。你可以找到我的 在我的github配置文件上发送电子邮件。
如何使用
请检查^ TT2} $与现有的预接地图像的基本用法。
您可以使用自己的图像,方法是将它们放在data目录中。 使用grounding.UserGrounder可以交互地完成接地图像。 有关详细信息,请查看example_grounding.py