使用Python安装pdfminer时的语法错误
我想用pdfminer来提取文本信息。我下载了pdfminer-20131113,并且在C:\python34
安装了Python。现在我在命令提示符下设置pdfminer的setup.py
文件的路径,然后运行以下命令。
python setup.py install
但是我遇到了下面的错误。
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
File "setup.py", line 3, in <module>
from pdfminer import __version__
File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
if __name__ == '__main__': print __version__
^
SyntaxError: invalid syntax
看起来是pdfminer的setup.py
文件出了点问题,我不知道该怎么解决。
另外,我在pdfminer的构建文件夹里看到了一个pdf2txt.py
文件。我也尝试用这个文件,命令是pdf2txt.py -o output.html pdffilename.pdf
(带上完整路径)。但是它不是转换文件,而是打开了pdf2txt.py
文件。
3 个回答
0
pdfminer.six 是一个支持 Python 2 和 3 的项目,使用了一个叫做 six 的工具。这个项目最近一次更新是在15天前。
6
这段代码应该能解决你在Python 3中的问题。
pip install pdfminer.six
7
PDFMiner项目主页上说:
这个项目完全是用Python写的。(需要Python 2.4或更新版本)
接下来还提到:
你需要安装Python 2.4或更新版本。(不支持Python 3。)
所以,要运行这个项目,你得安装Python 2。
另外,你也可以试试Python 3的版本,pdfminer3k
;不过这个版本已经有20个月没有更新了,而PDFMiner则有更新的版本,所以使用体验可能会有所不同。