使用Python进行文本布局识别

8 投票

2 回答

4470 浏览

提问于 2025-04-16 21:18

我正在处理几千个扫描文件，想把它们根据类型分类到不同的文件夹里。比如，如果某个文件是表格A的扫描件，那它就应该放到表格A的文件夹里；如果是表格B的扫描件，那就放到表格B的文件夹里，依此类推。我觉得最好的方法是根据文件的文字内容来匹配文件和类型，但我对图像处理完全是个新手，所以如果有更好的解决方案，我非常乐意听取建议。

我正在使用Python编程。有没有什么好的方法可以做到这一点？是用PIL？OpenCV？还是imageMagick？

提前谢谢大家...

图像处理文件管理文本分类 PIL opencv 光学字符识别文本布局识别

2 个回答

我不知道你扫描的文件是什么格式的，不过pdfminer可以对PDF文件进行布局分析。我想这可能适合你的需求，前提是你得到的文件是比较好的PDF格式（如果你只有“纯图片”，那就没什么用处了）。

回答于 2025-04-16 由 Python大师

分享举报

这个库可能会引起你的兴趣 -
http://code.google.com/p/ocropus/
它是谷歌的开发者制作的，可以让你在Python中进行文字识别（OCR）和布局分析。
我当初安装的时候遇到了一些问题，不过那是很久以前的事了，现在可能已经修复了。

回答于 2025-04-16 由 Python大师

分享举报

使用Python进行文本布局识别

2 个回答

撰写回答