PDFPY将大PDF分割成多个页面文件
抱歉如果这个问题之前有人问过,但我找不到我想要的确切答案。我有一个很大的PDF文件,里面有100个2页的表格(每个表格都有一个独特的标识符)。我想把这个文件拆分开来,让第1-2页放在一个新文件里,第3-4页放在另一个新文件里,依此类推。我该如何修改下面的代码来实现这个功能?目前的代码是把每一页单独拆分成一个文件。
from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))
for i in range(inputpdf.numPages):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i))
outputStream = file("abc-page%s.pdf" % i, "wb")
output.write(outputStream)
outputStream.close()
1 个回答
2
我觉得这就是你想要的。不过我没有验证过,结果可能会有所不同,具体情况要看你自己。
from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))
for i in range(inputpdf.numPages // 2):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i * 2))
if i * 2 + 1 < inputpdf.numPages:
output.addPage(inputpdf.getPage(i * 2 + 1))
outputStream = file("abc-page%s.pdf" % i, "wb")
output.write(outputStream)
outputStream.close()