查找两个PDF文档之间的差异
pdf-diff的Python项目详细描述
pdf差异
查找两个PDF文档之间的差异:
- 比较两个pdf文档的文本层,并以json格式输出更改文本的边界框。
- 将PDF中更改的页面光栅化为PNG,并围绕更改的文本绘制红色轮廓。
脚本是用python 3编写的,它依赖于pdftotext
程序。
要求
libxml2 >= 2.7.0, libxslt >= 1.1.23, poppler
ubuntu的安装要求:
sudo apt-get install python3-lxml poppler-utils
OS X的安装要求:
brew install libxml2 libxslt poppler
安装
来自PYPI:
pip install pdf-diff
来源:
sudo python3 setup.py install
运行
将两个PDF转换为一个显示差异的大PNG图像:
pdf-diff before.pdf after.pdf > comparison_output.png