如何根据图像质量确定使用哪种OCR方法

2024-06-02 09:11:55 发布

男 | 程序猿一只，喜欢编程写python代码。

我在问一个问题，因为我两周的研究开始让我感到困惑

我有一组图像，我想从中获得运行时的数字（这是Reinforcment学习中的奖励函数所需要的）。问题是，它们对我来说非常清楚（我知道对于OCR系统来说这是完全不同的事情，但这就是为什么我提供额外的图像来显示我所说的内容）

我认为这是因为它们相当清楚。所以我尝试使用PyTesseract，当它不起作用时，我尝试研究其他哪些方法对我有用

。。。这就是我在这里搜索的结果，因为两周的时间试图找出哪种方法最适合我的问题，这引发了更多的问题

目前我认为最好的解决方案是从MNIST/SVNH数据集创建数字识别模型，但这不是有点过分了吗？我的意思是，图像是标准化的，它们是灰度的，它们很小，并且数字字体保持不变，所以我认为有更简单的方法来修改这些图像/使用不同的OCR方法

这就是为什么我要问两个问题：

Tags：数据方法函数模型图像内容系统时间

1条回答

网友

1楼 · 发布于 2024-06-02 09:11:55

如果您必须识别的是这7段数字，请忘记任何OCR软件包

使用窗口的轮廓查找数字的大小和位置。然后计算七个预定义区域中的黑色像素，面向线段