我有一个模糊的图像:
这是名片的一部分,是相机拍摄的一帧,没有适当的焦距
清晰的图像如下所示 我正在寻找的方法,可以给我一个更好的图像质量,使图像可以识别的OCR,但也应该是相当快的。图像不太模糊(我想是的),但不利于OCR。我试过:
我还尝试:
但要找到正确的点扩散函数并不容易。这些方法被认为是有效的,但不够快。我还尝试了FFT,然后用高斯掩模进行IFFT,但结果并不令人满意。我正在寻找某种用文本消除图像模糊的通用方法,而不仅仅是这个图像。有人能帮我解决这个问题吗?如有任何建议,我将不胜感激。我正在使用OpenCV 3(C++和Python)
你知道Blind deconvolution吗
盲解卷积是恢复天文图像的一种著名技术。这对于很难找到PSF的应用程序特别有用
^ a2}是该技术的一种C++实现。这个paper也与您正在寻找的内容非常相关。以下是他们算法的示例输出:
我最近也遇到了这个问题,并提出了一个类似的question,其中有更多的细节和最新的方法。到目前为止,这似乎是一个尚未解决的问题。最近有一些研究工作试图通过深入学习解决这些问题。不幸的是,这些作品都没有达到我们的期望。不过,我正在分享这些信息,以防对任何人都有帮助
一,。野外场景文本图像超分辨率
就我们而言,这可能是我们最后的选择;相对而言,表现足够好。这是最近的一项研究工作(TSRN)主要关注此类案例。它的主要直观之处在于引入超分辨率(SR)技术作为预处理。这个implementation看起来是迄今为止最有希望的。这是他们的成就的说明,改善模糊以清洁图像
二,。神经增强
从他们的repo演示来看,它似乎也有一些改进模糊文本的潜力。然而,作者可能在大约4年内没有维持回购协议
三,。基于GAN的盲运动去模糊
吸引人的部分是其中的盲运动去模糊机制,名为DeblurGAN。看起来很有希望
四,。通过核估计和噪声注入实现真实世界的超分辨率
关于their work一个有趣的事实是,与其他文学作品不同,他们首先通过估算各种模糊核以及真实的噪声分布,为现实世界的图像设计了一个新颖的退化框架。基于此,他们获取与真实世界图像共享一个公共域的LR图像。然后,他们提出了一个现实世界的超分辨率模型,旨在更好地感知。从他们的文章中:
然而,在我的观察中,我没有得到预期的结果。我已经提出了一个issue on github,直到现在还没有得到任何回应
用于直接文本去模糊的卷积神经网络
@Ali分享的paper看起来非常有趣,结果非常好。很好,他们共享了经过训练的模型的预训练权重,还共享了python脚本以便于使用。然而,他们已经尝试了Caffe库。我更愿意转换成PyTorch,以便更好地控制。下面是提供的带有Caffe导入的python脚本。请注意,由于缺乏Caffe知识,我无法完全移植它,如果您知道的话,请纠正我
主要功能从这里开始
要运行该程序,请执行以下操作:
可以从here (BMVC_net)下载权重文件和上述脚本。但是,您可能需要转换caffe2pytorch。为此,以下是基本出发点:
其次,
在演示张量上运行
请注意,有一些基本的事情要考虑;网络期望文本的DPI为120-150,方向合理,黑白级别合理。这些网络预计从输入中减去[103.91116.8123.7]。输入值应进一步乘以0.004相关问题 更多 >
编程相关推荐