使用Python安装pdfminer时的语法错误

4 投票
3 回答
14641 浏览
提问于 2025-04-17 23:48

我想用pdfminer来提取文本信息。我下载了pdfminer-20131113,并且在C:\python34安装了Python。现在我在命令提示符下设置pdfminer的setup.py文件的路径,然后运行以下命令。

python setup.py install

但是我遇到了下面的错误。

> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
  File "setup.py", line 3, in <module>
    from pdfminer import __version__
  File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
    if __name__ == '__main__': print __version__
                                               ^
SyntaxError: invalid syntax

看起来是pdfminer的setup.py文件出了点问题,我不知道该怎么解决。

另外,我在pdfminer的构建文件夹里看到了一个pdf2txt.py文件。我也尝试用这个文件,命令是pdf2txt.py -o output.html pdffilename.pdf(带上完整路径)。但是它不是转换文件,而是打开了pdf2txt.py文件。

3 个回答

0

pdfminer.six 是一个支持 Python 2 和 3 的项目,使用了一个叫做 six 的工具。这个项目最近一次更新是在15天前。

6

这段代码应该能解决你在Python 3中的问题。

pip install pdfminer.six
7

PDFMiner项目主页上说:

这个项目完全是用Python写的。(需要Python 2.4或更新版本)

接下来还提到:

你需要安装Python 2.4或更新版本。(不支持Python 3。

所以,要运行这个项目,你得安装Python 2。

另外,你也可以试试Python 3的版本,pdfminer3k;不过这个版本已经有20个月没有更新了,而PDFMiner则有更新的版本,所以使用体验可能会有所不同。

撰写回答