如何使用Python代码在adobeacrobatreaderdc(及其函数)中将PDF自动保存为文本?

2024-04-19 08:40:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在有500个PDF文件要处理。其思想是在每个具有相同结构的PDF文件中提取特定的日期和名称。你知道吗

我真的很喜欢文本结构,当我把PDF转换成Adobe中的文本之后,我发现Python中的文本比我使用PyPDF2或PDFminer时更干净。你知道吗

通过使用操作系统启动文件,我可以在Adobe中打开pdf,但我不知道如何编写python代码,该代码会说“在Adobe中打开pdf文件,使用open file,使用Adobe函数将其保存为文本,然后关闭Adobe”。有人能帮我吗?你知道吗


Tags: 文件函数代码文本名称pdfopen结构