用python处理文档的一组实用程序类和函数
document_clipper的Python项目详细描述
文档剪辑器
用python处理文档的一组实用程序类和函数
- 自由软件:麻省理工学院许可证
- 文档:https://document-clipper.readthedocs.io。
安装
document\u clipper包使用依赖于 poppler utils包,例如: -pdftohtml -pdfimages -pftocairo
在尝试使用document\u clipper之前,请安装poppler utils包。
例如,在ubuntu中,可以通过运行以下命令来执行此操作:
$ sudo apt-get install poppler-utils
然后,您可以像往常一样通过python包管理器(如pip:
$ pip install document_clipper
功能
- 获取与PDF文件关联的页数。
- 提取pdf文件中给定文本的坐标和尺寸。
- 将多个PDF合并为一个PDF。
- 将多个pdf 和图像文件合并为一个pdf。
- 生成包含所提供的源PDF文件页的子集的新PDF文件。旋转可以单独应用于每一页。
- 可以选择预先修复切片/合并过程中涉及的文档。
历史记录
0.1.0(2017-06-27)
- pypi上的第一个版本。