使用opencv的python中的图像清理和ocr改进包。
athentoimaging的Python项目详细描述
#A进入成像系统
athento imaging是一个使用python和opencv开发的包,用于改进 文件。使用这个软件包测试的文件包括:护照,账单, 交付说明、预算和其他通用文档。
此软件包包括几个转换图像的功能:
- 删除彩色背景。
- 去除“盐和胡椒”噪音。
- 文档中的行检测(两种方法)。
- 删除文档中的行。
- 简单的线条分析(哪些线条是水平和垂直的,线条之间的距离等)
- 使用金字塔变换改进模板匹配。
您可以在这里查看所有内容:[athento imaging summary](<;docs/summary.md>;)
输出的质量及其ocr性能将取决于:
- 源文档的质量,随着质量值的增加,ocr也会增加。
- 文档中的噪音量及其位置。
- 文档水印的位置(如果有)。
- 文件的颜色。由于背景和文本之间的像素值接近,清晰的颜色比深色更容易去除。
- 你的个人形象转换经验。因为您可能需要执行操作组合或显著更改参数值。