我尝试打印pdf文档的页面:
import PyPDF2
FILE_PATH = 'my.pdf'
with open(FILE_PATH, mode='rb') as f:
reader = PyPDF2.PdfFileReader(f)
page = reader.getPage(0) # I tried also other pages e.g 1,2,..
print(page.extractText())
但我只得到了大量的空白,没有错误信息。PyPDF2是否不支持此pdf版本(my.pdf)
这解决了它(打印文档的所有页面)。谢谢
from pdfreader import SimplePDFViewer
fd = open("my.pdf", "rb")
viewer = SimplePDFViewer(fd)
for i in range(1,16): # need range from 1 - max number of pages +1
viewer.navigate(i)
viewer.render()
page_1_content=viewer.canvas.text_content
page_1_text = "".join(viewer.canvas.strings)
print (page_1_text)
如果为空,则表示正在读取PDF,并且pypdf无法读取其格式,因此它只输出为空。可能放在绝对文件路径而不是相对文件路径中。如果所有其他方法都失败了,请尝试使用不同的PDF,如果有一个版本可以工作,而您的版本不能工作,那么您可能需要将您的版本转换为该工作类型
试试pdfreader
相关问题 更多 >
编程相关推荐