在对手写文本执行文本检测和识别之前,我尝试从多个笔记本页面中删除规则和背景笑脸。在
一个earlier thread提供了一些有用的提示,但是我的问题在几个方面有所不同。在
- 要保留的文本将写在要删除的背景项上。在
- 要删除的项目与文本的颜色不同,这可能是删除它们的关键。在
- 要去掉的线条不是很笔直,笑脸就更不笔直了。在
我正在考虑使用OpenCV来完成这项任务,但我愿意使用ImageMagick或命令行GIMP,只要我可以同时处理整个批处理。由于我以前从未使用过这些工具,因此欢迎提供任何建议。非常感谢。在
Tags:
这里有一个简单的方法,假设文本是蓝色的
我们首先将图像转换为HSV格式,然后创建一个掩码来隔离字符
现在我们执行形态学变换来去除小噪声
^{pr2}$我们有所需的文本轮廓,这样我们就可以通过用原始图像遮罩来隔离字符
最后,为了准备OCR/Tesseract图像,我们将字符改为黑色
完整代码
相关问题 更多 >
编程相关推荐