按外观而不是按内容比较两个PDF文件。

pdfcomparator的Python项目详细描述


VERSIONDOWNLOADSTESTSCOVERAGE
Latest PyPI versionNumber of PyPI downloadsTravis resultsCoveralls results_

按外观而不是按内容比较两个PDF文件。它可以在命令行中使用,以便在更大的脚本中使用。

安装

它需要一些库。在debian或ubuntu中,您可以通过apt:

# apt-get install libpoppler-glib-dev python-gtk2 python-cairo-dev python-gobject-dev python-gobject

确保您有一个实际版本的gcc,因为pycairo将需要它(它将选项-fstack protector strong添加到编译选项中)。这个库很难安装,所以这里有我使用的命令行:

$ pip install pycairo==1.8.8 –allow-unverified pycairo –allow-external pycairo

然后您可以照常安装:

$ pip install pdfcomparator

用法

格式是下一个:

$ pdfcompare.py pattern current

它将比较“pattern”和“current”下的文件。

如果他们是平等的,那就什么也印不出来。如果它们不同,它将打印不同的第一页,脚本将返回2。

相似性

通常,两页纸相等或不相等。但也许你只需要一个相似度百分比。所以,你可以用百分比。通常,这会使比较变慢。

因此,它将使用不同的算法来检查上相似度。当其中任何一个失败时,整个比较就失败了。

您可以使用选项–precise启用精确算法,并且您可以使用0到1之间的任意数字,使用–ratio=0.8设置相似度比率。

好好享受吧!

贡献

如果您想参与,请创建一个virtualenv环境:

$ virtualenv venv --system-site-packages
$ . venv/bin/activate

为了找到python gobject库,使用系统包很重要。

现在,您应该可以安装pdfcomparator包:

$ python setup.py develop

要测试它:

$ python setup.py test

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Maven无法识别安装在Ubuntu外壳上的$java_HOME jdk   java如何防止可运行程序在其中一个抛出异常时执行   java Listview在按下项时不触发   如何在WindowsPhone8中使用JavaRESTWebService?   java在spring引导下使用多个dispatcher servlet/web上下文   java为什么在删除容器的绝对大小时不绘制GEF子项?   java在hibernate实体中保留DB约束是好的   JavaSpring选择最高优先级bean   ArrayList<Class>java字符串[]   有向加权边图的Java邻接表实现   字母数字字符串的java Tesseract配置:混合2、Z、6和G   如果输入为空,则带有EditText的java警报对话框将关闭   jsp上的java Struts 2动作响应   java获取IndexOutOfBundException Android   scala AWSJAVASDK:解压缩大小必须小于262144000字节