使用pyPdf识别PDF中的粗体文本
我正在使用 pyPdf
这个工具来从PDF文件中提取文字。我想知道哪些文字是加粗的,这样我就能找到加粗的章节标题。请问我该如何识别加粗的文字呢?
1 个回答
0
pypdf 这个库并不直接支持这个功能——虽然不是完全不可能,但你需要付出不少努力。而且因为 pypdf 现在已经不再维护了,所以这个情况不会改变。
目前(2022年5月),PyPDF2 也没有这个功能,不过我欢迎有人提交请求来增加这个支持。