使用PDFMiner编辑PDF文件

2 投票
2 回答
2588 浏览
提问于 2025-04-17 06:57

我在想,能不能用Pdfminer来编辑一个已经存在的pdf文件。这个工具看起来很强大,但文档资料很少,几乎没有。我找到了一些例子,但都不太符合我的需求。我想做一个搜索引擎,可以在pdf文件中把我的关键词变成不同的颜色。

2 个回答

0

不,pdfminer不支持编辑功能。

不过,如果你不想修改PDF文件,而是使用PDFOpenParameters,可能会简单很多:http://partners.adobe.com/public/developer/en/acrobat/PDFOpenParameters.pdf

你可以像这样使用网址片段标识符:

http://www.example.com/test.pdf#search=foo

或者在命令行打开Acrobat时(Windows的例子)

AcroRd32.exe /A "search=foo" test.pdf

你还可以打开PDF的特定页面,并高亮显示该页面的某个区域(但不能同时在不同页面上高亮不同区域)。

(好吧,我知道这并不是你问的问题的真正解决方案,但如果这对你来说足够用,那就简单得多了)

0

PDFMiner 这个工具并不是用来修改已有的 PDF 文件的,而是用来从 PDF 文件中提取文本和一些元数据。你想要的功能,最接近的解决方案可能就是使用它自带的 pdf2txt.py 工具来提取文本,然后再对提取出来的文本进行标记,以突出显示你的关键词。

另外,还有一个简单的办法,就是使用带有查找和高亮多个搜索词功能的 PDF 阅读器。我觉得 Adobe Acrobat 可以做到这一点,但其他的我就不太确定了。

撰写回答