如何用python提取pdf中包含图像的页面？

1条回答

网友

1楼 · 发布于 2024-05-28 23:23:36

这是一种简单的方法，它扫描所有书签以找到匹配的对象，然后扫描每个页面，直到它与同一对象匹配。可能不是最优雅的方法，但应该能完成任务。在

from PyPDF2 import PdfFileReader
reader = PdfFileReader('D:\\Downloads\Sample.pdf')

# Scan outlines for bookmark containing KYC
outlines = reader.outlines
print(outlines)
for bookmark in outlines:
    print(bookmark['/Title'])
    print(bookmark['/Page'])
    if bookmark['/Title'] == 'KYC':
        mypage = bookmark['/Page']

# Scan page looking for the matching object        
print(reader.getNumPages())
for x in range(0, reader.getNumPages()): 
    apage = reader.getPage(x)
    print(apage)
    if apage == mypage:
        print('Eureka on page', x + 1)

编程相关推荐

Java RMI客户端访问被拒绝
java让JavaFX事件监听器与我的方法对话
java与xml spring配置相关
java当我在字符串中插入这个XML Soap请求时，为什么Eclipse会给我一个错误？
音频音频合成
java创建了一个Tic-Tac-Toe应用程序，我有一个bug，它每次在同一个正方形上声明一个平局
java为返回的字符串值设置参数
Java中的ClassFormatError
java在启动后更改Spring云配置服务器uri
用Java中的自定义类替换默认字符串类

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何用python提取pdf中包含图像的页面？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >