我需要从PDF文档中提取PDF版本。我尝试了PDF miner,但它仅提供以下信息:
下面是我尝试的代码:
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
fp = open("ibs.servlets.pdf", 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
parser.set_document(doc)
if len(doc.info) > 0:
info = doc.info[0]
print(info)
除了pdf miner,还有其他库可以使用吗
PDF版本作为注释存储在PDF文件的第一行中。我无法找到如何使用pdfparser获取此信息,但使用PyPDF2我可以手动检索此信息:
输出:
相关问题 更多 >
编程相关推荐