apache pdfbox命令行工具的python接口。

python-pdfbox的Python项目详细描述


包装说明

Apache PDFBox提供一个简单的python 3接口 命令行工具。

Latest Version

要求

除了python 3和 setup.py, python pdfbox要求系统路径中存在java

安装

软件包的安装方法如下:

pip install python-pdfbox

可以通过^{tt2}指定pdfbox jar文件的位置。$ 环境变量。如果未设置,python pdfbox将查找jar文件 在特定于平台的用户缓存目录中并自动下载 如果不存在就缓存它。

用法

该界面目前仅在pdfbox中显示两个功能:文本提取和图像转换:

import pdfbox
p = pdfbox.PDFBox()
text = p.extract_text('/path/to/my_file.pdf')
p.pdf_to_images('/path/to/my_file.pdf')

开发

最新版本的软件包可以从 GitHub

作者

有关详细信息,请参见包含的AUTHORS.rst文件 信息。

许可证

本软件在 Apache 2.0 License。 有关详细信息,请参见包含的LICENSE.rst文件 信息。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java允许具有不同父类的类扩展类,而无需多重继承   java如何创建动态化的JScrollPane w/JPanel作为客户端?   java如何组织和命名包   在Java中读取属性文件   java无法解释的Android意图行为   在Java中动态执行多个BPEL文件的部署   ssl Java 6 SNI(服务器名称指示)?   java我们可以使用Robot框架自动化web和移动应用程序来执行并行执行   java for star pettern的循环   java为什么BinaryReader在线程中,从netty读取错误的数据包?   在java中将华氏度转换为摄氏度   使用Spark和java处理空值和引号编写CSV文件   Java中已排序日期到块的列表   visual studio代码VSCode Java不是linting或自动完成局部变量,而是自动完成Java快捷方式,如“sysout”