转换PDF为文本Python

2024-04-27 18:00:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我要将pdf转换为指定目录中的文本

这是我试过的密码

import os
import subprocess

def pdftotext(pdf):
    # insert your code here
    basename, _ = os.path.splitext(os.path.basename(pdf))
    subprocess.call(['pdftotext', '-enc', 'UTF-8',
                 pdf, os.path.join('c:\pdf\pydf\data', basename + '.txt')])

pdftotext("C:\\pdf\\pydf\\pdfs\\ipm.pdf")
with open(os.path.join('c:\\pdf\\pydf\\data', 'ipm.txt')) as infile:
   print(infile.read(1000))

但它会出错

^{pr2}$

我的代码怎么了?在


Tags: path文本import目录txtdatapdfos
1条回答
网友
1楼 · 发布于 2024-04-27 18:00:30

文件的路径不正确,而不是C:\pdf\pydf\pdfs\ipm.pdf版使用 os.path.join操作系统('c:','PDF','PDF','ipm.pdf版')

相关问题 更多 >