S3上的PDFS文件分割

S3PdfSplitter的Python项目详细描述


s3pdfsplitterBuild StatusCoverage StatusPyPI versionPyPI - Python Version

python aws-s3 pdf拆分器

用法

基本用法:

fromPdfSplitterimportSplitterspliter=Splitter("config.json")spliter.split(data)

例如config.json:

{"aws":{"access_key_id":"aws-acces-key","secret_access_key":"aws secret",},"s3":{"bucket":"bucket"}}

请注意,配置是用ConfigEnv管理的,因此您可以提供一个.ini文件,或者覆盖配置和环境变量(aws_s3_bucket、aws_access_key_id和aws_secret_access_key)

示例数据:

{"input":["firstFile.pdf","secondFile.pdf"],"output":[{"s3Key":"output1.pdf","pages":[{"index":0,"pages":[0,1]},{"index":1,"pages":[0,1]}]},{"s3Key":"output2.pdf","pages":[{"index":0,"pages":[0]},{"index":1,"pages":[0]},{"index":0,"pages":[1]},{"index":1,"pages":[1]}]}]}

这将在您的s3中生成两个pdf:

  • 第一个是output1.pdf,第0页和第1页来自firstfile,第0页和第1页来自secondfile
  • 第二个,output2.pdf,第0页来自firstfile,第0页来自secondfile,第1页来自firstfile,第1页来自secondfile

开发指南

安装

使用virtualenv:

# create virtualenv
virtualenv -p python3 .venv

# activate venv
source .venv/bin/activate

# install dependancies
pip install -r requirements.txt
pip install -r requirements-dev.txt

测试

使用unittest:

# if your test config is setup :
python -m unittest

# if you want to overide your test config :
S3_BUCKET=<your bucket> AWS_ACCESS_KEY_ID=<your key id> AWS_SECRET_ACCESS_KEY=<your key secret> python -m unittest

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
序列化反序列化java。awt。颜色>java。木卫一。InvalidClassException   java禁用多个日期范围jDateChooser   java为什么我的特例apper会被扔进泽西/灰熊?   JavaIntelliJ比较两个覆盖率数据   java什么是servletsdefault。你怎么办?   单击几下libgdx后java按钮没有响应   使用java将字符串转换为JSONArray   文件系统在java中刷新fileSystemViewer   java如何在hibernate中避免脏检查   java奇怪的问题,带有分号和“无法解决…”   java将值从子面板传递到父面板   HTML JTextPane CSS的Java FontSizeAction   java文件代码神秘地变成了一堆(0000)