pdfminer3k在PDFPag中没有名为create_pages的方法

2条回答

网友

1楼 · 编辑于 2024-05-14 09:09:32

也许，你可以用pdfminer.6。描述如下：

fork of PDFMiner using six for Python 2+3 compatibility

使用pip安装后：

pip install pdfminer.six

它的用法就像pdfminer，至少在我的代码中是这样。

希望这能拯救你的一天：）

网友

2楼 · 编辑于 2024-05-14 09:09:32

如果您对从pdf文件中读取文本感兴趣，以下代码将使用python 3.4与pdfminer3k一起使用。

from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams, LTTextBox, LTTextLine

fp = open('file.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument()
parser.set_document(doc)
doc.set_parser(parser)
doc.initialize('')
rsrcmgr = PDFResourceManager()
laparams = LAParams()
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
# Process each page contained in the document.
for page in doc.get_pages():
    interpreter.process_page(page)
    layout = device.get_result()
    for lt_obj in layout:
        if isinstance(lt_obj, LTTextBox) or isinstance(lt_obj, LTTextLine):
            print(lt_obj.get_text())

fp.close()

相关问题更多 >

编程相关推荐

热门问题

热门文章

pdfminer3k在PDFPag中没有名为create_pages的方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >