2024-04-18 22:54:47 发布
网友
我在做一个文本识别项目。 我已经建立了一个使用TensorFlow预测数字的分类器,但是我想通过使用文本定位和文本分割(分离每个字符)来实现一个更复杂的文本识别算法,但是我没有找到实现这些算法的部分。在
那么,你知道一些算法/实现/技巧I,使用TensorFlow,在自然场景图片中定位文本并进行文本分割(实际上是在体育图片的记分板中对文本进行定位和分割)?在
非常感谢你的帮助。在
要对页面上的元素(如文本和图像的段落)进行分组,可以使用一些聚类算法和/或带有一些树的blob检测。在
您可以使用Radon变换来识别行并检测扫描页面的倾斜。在
我认为为了字符分离,你必须搞乱字体。一些多项式匹配/拟合之类的。(目前这只是一个非常疯狂的猜测,不要当真)。 但类似的方法可以让你把角色从线里拿出来,然后在同一步中识别出来。在
至于识别,一旦你有了一个字符,就有了一个很好的三角函数技巧来比较字符的角度和数据库中存储的角度。 笔迹也很好。在
我不是一个网页分割到底是如何工作的专家,但似乎我正在努力成为一个。只是在做一个包括它在内的项目。 所以给我一个月的时间,我就能告诉你更多。:天
不管怎样,你应该去阅读Tesseract代码,看看惠普和谷歌是如何做到的。它会给你很多好主意。在
祝你好运!在
要对页面上的元素(如文本和图像的段落)进行分组,可以使用一些聚类算法和/或带有一些树的blob检测。在
您可以使用Radon变换来识别行并检测扫描页面的倾斜。在
我认为为了字符分离,你必须搞乱字体。一些多项式匹配/拟合之类的。(目前这只是一个非常疯狂的猜测,不要当真)。 但类似的方法可以让你把角色从线里拿出来,然后在同一步中识别出来。在
至于识别,一旦你有了一个字符,就有了一个很好的三角函数技巧来比较字符的角度和数据库中存储的角度。 笔迹也很好。在
我不是一个网页分割到底是如何工作的专家,但似乎我正在努力成为一个。只是在做一个包括它在内的项目。 所以给我一个月的时间,我就能告诉你更多。:天
不管怎样,你应该去阅读Tesseract代码,看看惠普和谷歌是如何做到的。它会给你很多好主意。在
祝你好运!在
相关问题 更多 >
编程相关推荐