当我运行下面的代码将pdf图像转换为jpg策略时，错误弹出

1条回答

网友

1楼 · 发布于 2024-04-19 20:25:36

您可以使用以下代码将pdf文件中的图像转换或提取为jpg或其格式

requirements.txt：

PyMuPDF==1.16.5
python-dateutil==2.8.0
pytz==2019.3
six==1.12.0

代码：

import fitz
import random, string

doc = "mypdf.pdf" # path to pdf file
doc = fitz.open(doc)
pno = doc.loadPage(4) # enter the page
text = pno.getText('dict')# dict format of the file
blocks = text["blocks"]
imgblocks = [b for b in blocks if b["type"] == 1]

x = ''.join(random.choice(string.ascii_uppercase + string.ascii_lowercase + 
string.digits) for _ in range(16))

if imgblocks:
   for index, img in enumerate(imgblocks):
       img_name1 = "%s-%s.%s" % (x, index, img['ext']) # png
       img_name2 = "%s-%s.jpg" % (x, index) # jpg
       with open(img_name1, 'wb') as f:
            f.write(img['image'])

       with open(img_name2, 'wb') as f:
            f.write(img['image'])

编程相关推荐

java为什么当我推送更少的数据时堆栈会溢出？
JavaBridge。war+tomcat+phpcgi+glibc_2.7缺少库问题
java获取面板的gridbag约束
基于Web的java应用程序模拟远程处理PLC
默认情况下，javaf:ajax rendered=false
python解决此类问题的最佳方法是什么？（谷歌Foobar 3级）
java获取记录所在的mysql表的名称
java在添加Pulsar appender时收到log4j2的“未找到appender”错误
java子查询结果和一个HQL中的所有表字段
用于读取库代码中文件的java文件路径

相关问题更多 >

编程相关推荐

热门问题

热门文章

当我运行下面的代码将pdf图像转换为jpg策略时，错误弹出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >