即使在Python中尝试pdfminer、pdf2txt、textract,也无法将pdf转换为文本

2024-06-10 20:04:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个困难,从pdf文件中提取文本最初是从InDesign和Illustrator转换的。我正在做一个需要这些pdf文件数据的项目。我尝试过Python中的pdfminer、pdf2txt libs,但在本例中它们都不起作用。对于普通的pdf格式,它可以完美地工作。但是,对于这些特殊的pdf文件,它只提供空白。有人能帮我吗?谢谢。在


Tags: 文件数据项目文本pdf格式pdfminer空白