使用Python突出显示PDF中的文本

2024-06-07 07:09:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在为我的PDF数据语料库定制搜索引擎。

我有一个转换层,可以将PDF内容转储到文本(使用Apache Tika和GROBID)。我已经完成了搜索层和返回搜索结果列表的视图。

现在,我想在原来的PDF中为出现搜索词的行添加突出显示功能。是的,如果有必要的话,我想修改PDF文件。

有没有办法在PDF文件中突出显示文本?PDFMiner、PyPDF2或其他Python库是否能够做到这一点?

。。。或者你能推荐其他的,也许是外部服务吗?


Tags: 文件数据文本功能视图内容列表pdf