以表格数据的形式读取pdf文件中的表格
pyexcel-pdfr的Python项目详细描述
支持项目
如果您的公司已经将pyexcel及其组件嵌入到一个产生收入的 产品,请在patreon上支持我 或者bounty source来维护 并进一步发展。
如果你是个人,欢迎你也支持我,不管多久 你想。作为我的支持者,你将得到 early access to pyexcel related contents。
如果你想成为我的patreonpyexcel pro用户,你的问题将被优先考虑。
有你的经济支持,我可以投资 在编码、文档和写有趣的文章上多花点时间。
简介
pyexcel pdfr将pdf文件中的表作为表格数据读取。请注意,它仅适用于Python2.7。
安装
您可以通过pip:
$ pip install pyexcel-pdfr
或者克隆并安装:
$ git clone https://github.com/pyexcel/pyexcel-pdfr.git
$ cd pyexcel-pdfr
$ python setup.py install
开发指南
代码更改的开发步骤
- git克隆https://github.com/pyexcel/pyexcel-pdfr.git
- cd pyexcel pdfr
升级安装工具和pip。它们仅用于开发和测试:
- pip安装-升级setuptools pip
然后安装相关的开发要求:
- PIP-Real-RrNdReavest.txt>如果该文件存在
- pip install-r requirements.txt
- pip安装-r tests/requirements.txt
完成更改后,请提供测试用例和相关文档 并更新changelog.rst。
注意
对于rnd_requirements.txt,通常是在 库未释放。一旦安装了dependecy (即将发布),未来 requirements.txt中的依赖项版本将有效。
如何测试您的贡献
尽管nose和doctest都用于代码测试,但是将单元测试放在测试中是可取的。doctest的合并只是为了确保文档中的代码示例在不同的开发版本中保持有效。
在Linux/Unix系统上,请启动如下测试:
$ make
在Windows系统上,请发出以下命令:
> test.bat
如何更新测试环境和更新文档
需要其他步骤:
- pip安装moban
- git克隆https://github.com/moremoban/setupmobans.git常规设置
- git克隆https://github.com/pyexcel/pyexcel-commons.git公共空间
- 在.moban.d目录中进行更改,然后发出命令moban
什么是pyexcel commons
许多跨pyexcel项目共享的信息,例如:本开发人员指南、许可证信息等,都存储在pyexcel commonsproject中。
什么是.moban.d
.moban.d存储库的特定元数据。
验收标准
- 编写了测试用例
- 已测试所有代码行
- 通过所有Travis CI生成
- 如果您的更改很复杂,请提供相当数量的文档
- 运行“make format”以确认PyExcel组织的编码风格
- 请更新changelog.rst
- 请加入投稿人。rst
- 为您的贡献商定新的BSD许可证
许可证
新的BSD许可证
更改日志
0.5.0-rc1-14.03.2019
首次发布
- 从pdf格式中读取表格数据