PDF页面拆分PDF的大小正在增加

2024-06-16 09:11:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经使用PyPDF2创建了一个PDF拆分器。它将大小超过20Mb的PDF拆分为多个较小的PDF

我使用的逻辑是将所有页面分割为单页PDF,并找到每个页面的大小。添加大小,直到达到20MB并拆分

我面临的问题是,PDF中的某些页面的大小几乎与原始PDF相同。虽然当我手动提取页面时,大小约为500Kb

不知道为什么尺寸会增加。请帮我解决这些问题

for i in range(pdf_reader.numPages):
    # New PDF with each page
    outputpdf = newpath + '\\' + pp.split('.pdf')[0] + 'page' + str(i+1) +'.pdf'

    #PDF Writer

    output = PyPDF2.PdfFileWriter()

    #Writing each page to PDF Writer

    output.addPage(pdf_reader.getPage(i))

    #Write into the new PDF

    with open(outputpdf, "wb") as outputStream:

         output.write(outputStream)

Tags: outputpdfwithpage单页页面手动逻辑