我正在尝试使用Python从PDF文件中提取文本,我的主要目标是提取主文件中没有标题的文本
这是示例图像,标题指的是红色矩形: enter image description here
这里是PDF文件链接:https://mega.nz/file/d0YkhB5Y#j7eA0EBxg70Yu36PjGocNjouP_xQFoRRAN7VfyDeClo
当前将PDF文件中的文本提取为字符串的最佳和最简单的方法是什么? 我试过使用pdfplumber,但是在阅读了它的用户指南之后,我仍然不知道如何使用它
谢谢你的帮助
PDFPLUBER的回购协议为here。除了表格提取外,它还可以提取文本、字符、矩形和线条。一个简单的例子是:
相关问题 更多 >
编程相关推荐