我在问一个问题,因为我两周的研究开始让我感到困惑
我有一组图像,我想从中获得运行时的数字(这是Reinforcment学习中的奖励函数所需要的)。问题是,它们对我来说非常清楚(我知道对于OCR系统来说这是完全不同的事情,但这就是为什么我提供额外的图像来显示我所说的内容)
我认为这是因为它们相当清楚。所以我尝试使用PyTesseract,当它不起作用时,我尝试研究其他哪些方法对我有用
。。。这就是我在这里搜索的结果,因为两周的时间试图找出哪种方法最适合我的问题,这引发了更多的问题
目前我认为最好的解决方案是从MNIST/SVNH数据集创建数字识别模型,但这不是有点过分了吗?我的意思是,图像是标准化的,它们是灰度的,它们很小,并且数字字体保持不变,所以我认为有更简单的方法来修改这些图像/使用不同的OCR方法
这就是为什么我要问两个问题:
如果您必须识别的是这7段数字,请忘记任何OCR软件包
使用窗口的轮廓查找数字的大小和位置。然后计算七个预定义区域中的黑色像素,面向线段
相关问题 更多 >
编程相关推荐