使用pyPdf识别PDF中的粗体文本

7 投票
1 回答
942 浏览
提问于 2025-04-19 17:14

我正在使用 pyPdf 这个工具来从PDF文件中提取文字。我想知道哪些文字是加粗的,这样我就能找到加粗的章节标题。请问我该如何识别加粗的文字呢?

1 个回答

0

pypdf 这个库并不直接支持这个功能——虽然不是完全不可能,但你需要付出不少努力。而且因为 pypdf 现在已经不再维护了,所以这个情况不会改变。

目前(2022年5月),PyPDF2 也没有这个功能,不过我欢迎有人提交请求来增加这个支持。

撰写回答