apache pdfbox命令行工具的python接口。
python-pdfbox的Python项目详细描述
要求
除了python 3和 setup.py, python pdfbox要求系统路径中存在java。
安装
软件包的安装方法如下:
pip install python-pdfbox
可以通过^{tt2}指定pdfbox jar文件的位置。$ 环境变量。如果未设置,python pdfbox将查找jar文件 在特定于平台的用户缓存目录中并自动下载 如果不存在就缓存它。
用法
该界面目前仅在pdfbox中显示两个功能:文本提取和图像转换:
import pdfbox p = pdfbox.PDFBox() text = p.extract_text('/path/to/my_file.pdf') p.pdf_to_images('/path/to/my_file.pdf')
开发
最新版本的软件包可以从 GitHub。
许可证
本软件在 Apache 2.0 License。 有关详细信息,请参见包含的LICENSE.rst文件 信息。