如何从pdf中提取一个页面,同时将其放入zip

2024-03-29 12:55:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个脚本,它对文件进行排序并生成一个元组,看起来像statfiles=[filename1,filename2,felename3……]。 然后我需要为这些文件获取相应的PDF文件,从该文件中提取一个页面,并创建一个包含所有已处理PDF文件的zip文件。现在,我只能做到这一点,如果我把一个提取的页面保存到单独的(plots\uext)temp文件夹中,然后从该文件夹中获取文件并将其放入存档。我相信它可以做到,而不是实际上保存到临时文件夹。但是我在Python方面没有那么丰富的经验,所以我还不确定如何完成这个任务。你知道吗

下面是我的代码中执行解压缩任务的部分:

pdfs = zipfile.ZipFile("hi_eff.zip","w"

for item in statfiles:

     output = pyPdf.PdfFileWriter()
     input1 = pyPdf.PdfFileReader(open('plots/'+item+".pdf", "rb"))
     output.addPage(input1.getPage(0))
     outputStream = open('plots_ext/'+item+".pdf", "wb")
     output.write(outputStream)
     outputStream.close()    

try:
    pdfs.write('plots_ext/'+item+".pdf")
except:
    print ('No PDF file for ', filename)

pdfs.close()

Tags: 文件文件夹foroutputpdf页面zipitem