如何根据图像质量确定使用哪种OCR方法

2024-06-02 09:11:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我在问一个问题,因为我两周的研究开始让我感到困惑

我有一组图像,我想从中获得运行时的数字(这是Reinforcment学习中的奖励函数所需要的)。问题是,它们对我来说非常清楚(我知道对于OCR系统来说这是完全不同的事情,但这就是为什么我提供额外的图像来显示我所说的内容)

enter image description hereenter image description hereenter image description here

我认为这是因为它们相当清楚。所以我尝试使用PyTesseract,当它不起作用时,我尝试研究其他哪些方法对我有用

。。。这就是我在这里搜索的结果,因为两周的时间试图找出哪种方法最适合我的问题,这引发了更多的问题

目前我认为最好的解决方案是从MNIST/SVNH数据集创建数字识别模型,但这不是有点过分了吗?我的意思是,图像是标准化的,它们是灰度的,它们很小,并且数字字体保持不变,所以我认为有更简单的方法来修改这些图像/使用不同的OCR方法

这就是为什么我要问两个问题:

  1. 哪种方法对我的案例最有用,如果不是模型的话 是否接受过MNIST/SVNH数据集培训
  2. 是否有任何类型的文档/书籍/资源可以使基础架构的实际选择更容易?我是说 将来我会再次计划使用哪种OCR系统。 我应该在什么基础上作出选择?这纯粹是试错吗 事情

Tags: 数据方法函数模型图像内容系统时间
1条回答
网友
1楼 · 发布于 2024-06-02 09:11:55

如果您必须识别的是这7段数字,请忘记任何OCR软件包

使用窗口的轮廓查找数字的大小和位置。然后计算七个预定义区域中的黑色像素,面向线段

enter image description here

相关问题 更多 >