我正在尝试获取pdf文件的元数据
from pdfminer3.pdfparser import PDFParser
from pdfminer3.pdfdocument import PDFDocument
fp = open('C:/Users/asus/Desktop/storage/jdghosh_sap@rediffmail.com.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
print(doc.info[0]["CreationDate"])
print(doc.info[0]["ModDate"])
输出
^{pr2}$如何将这些数据解析为python日期?在
做了一个小函数来转换它:
由于某些原因,在我的linux机器上,在datetime字符串的末尾没有以+开头的后缀,我怀疑它可能与时区有关,或者可能取决于pdf文件本身是如何创建的。在
无论如何,上面的代码应该涵盖这两种情况。在
相关问题 更多 >
编程相关推荐