使用Python进行文本布局识别

8 投票
2 回答
4470 浏览
提问于 2025-04-16 21:18

我正在处理几千个扫描文件,想把它们根据类型分类到不同的文件夹里。比如,如果某个文件是表格A的扫描件,那它就应该放到表格A的文件夹里;如果是表格B的扫描件,那就放到表格B的文件夹里,依此类推。我觉得最好的方法是根据文件的文字内容来匹配文件和类型,但我对图像处理完全是个新手,所以如果有更好的解决方案,我非常乐意听取建议。

我正在使用Python编程。有没有什么好的方法可以做到这一点?是用PIL?OpenCV?还是imageMagick?

提前谢谢大家...

2 个回答

1

我不知道你扫描的文件是什么格式的,不过pdfminer可以对PDF文件进行布局分析。我想这可能适合你的需求,前提是你得到的文件是比较好的PDF格式(如果你只有“纯图片”,那就没什么用处了)。

4

这个库可能会引起你的兴趣 -
http://code.google.com/p/ocropus/
它是谷歌的开发者制作的,可以让你在Python中进行文字识别(OCR)和布局分析。
我当初安装的时候遇到了一些问题,不过那是很久以前的事了,现在可能已经修复了。

撰写回答