使用PDFMiner编辑PDF文件
我在想,能不能用Pdfminer来编辑一个已经存在的pdf文件。这个工具看起来很强大,但文档资料很少,几乎没有。我找到了一些例子,但都不太符合我的需求。我想做一个搜索引擎,可以在pdf文件中把我的关键词变成不同的颜色。
2 个回答
0
不,pdfminer不支持编辑功能。
不过,如果你不想修改PDF文件,而是使用PDFOpenParameters,可能会简单很多:http://partners.adobe.com/public/developer/en/acrobat/PDFOpenParameters.pdf
你可以像这样使用网址片段标识符:
http://www.example.com/test.pdf#search=foo
或者在命令行打开Acrobat时(Windows的例子)
AcroRd32.exe /A "search=foo" test.pdf
你还可以打开PDF的特定页面,并高亮显示该页面的某个区域(但不能同时在不同页面上高亮不同区域)。
(好吧,我知道这并不是你问的问题的真正解决方案,但如果这对你来说足够用,那就简单得多了)
0
PDFMiner 这个工具并不是用来修改已有的 PDF 文件的,而是用来从 PDF 文件中提取文本和一些元数据。你想要的功能,最接近的解决方案可能就是使用它自带的 pdf2txt.py
工具来提取文本,然后再对提取出来的文本进行标记,以突出显示你的关键词。
另外,还有一个简单的办法,就是使用带有查找和高亮多个搜索词功能的 PDF 阅读器。我觉得 Adobe Acrobat 可以做到这一点,但其他的我就不太确定了。