数字篡改检测包

drdigit-brezniczk的Python项目详细描述


drdigit是一个早期的数字篡改检测包。 对贡献感兴趣?请随时与我联系,例如 评论“欢迎投稿人!“在 https://github.com/brezniczky/drdigit/issues/1

要求

drdigit需要python 3.5或更高版本。

概念

这些测试是基于数字的统计,这些数字被假定为 均匀分布近似均匀分布可以通过查找 在足够大的值的最后几位-例如投票计数 (可能超过100)

在较小的范围内,可以使用 用python函数表示的概率质量函数。

对于一系列数字组,有更大规模的测试。真是太好了 支持不同的组预期被 不同的人-测试一个总体的、一致的异常也可能是 在这种情况下是严格的。

基于当前特征(熵、数字重复、重合数字 并行序列),可以对包含数字组的数据帧进行排序 根据概率,所以可以检查是否有明显的 医生背后的理智。

一些暗示

  • 小心处理结果,始终存在一些不确定性

  • 试着focus关注感兴趣的群体,这会产生更清晰的结果

  • 提交kaggle脚本时,请关闭测试的磁盘缓存 在提交之前,例如通过

    ^{tt1}$

    您可以通过帮助(drd.set_选项)找到更多信息。

快速启动

可以使用pip安装DrDigit:

$ pip install drdigit-brezniczky $ ipython

当不同的数字序列长度 考虑一下-序列1,2不是尽可能的多样化吗?

Python 3.5.2 (default, Nov 12 2018, 13:43:14) Type ‘copyright’, ‘credits’ or ‘license’ for more information IPython 7.7.0 – An enhanced Interactive Python. Type ‘?’ for help.

In [1]: import drdigit as drd

In [2]: help(drd)

In [3]: print(drd.get_entropy([1, 2])) 0.6931471805599453

In [4]: print(drd.get_entropy([1, 1, 2, 2])) 0.6931471805599453

概率通常更适合于比较:

In [6]: drd.prob_of_entr(2, drd.get_entropy([1, 2])) cdf for 2 was generated Out[6]: 1.0

In [7]: drd.prob_of_entr(4, drd.get_entropy([1, 1, 2, 2])) cdf for 4 was generated Out[7]: 0.0624

事实上,后一个序列异常重复。

下面是更多的例子,现在您可以查看kaggle笔记本 https://www.kaggle.com/brezniczky/poland-2019-ep-elections-doctoring-quick-check 或在附近 https://github.com/brezniczky/ep_elections_2019_hun/blob/master/PL/ 例如在process_data.py文件中

一些复杂的(抱歉,有时不可靠/有些过时)细节 关于考虑因素/方法和未来想法,请参见 [匈牙利选举文件]( https://nbviewer.jupyter.org/github/brezniczky/ep_elections_2019_hun/blob/master/report.ipynb

测试

有几个测试可以通过pytest运行

为此,我只需使用virtualenvwrapper并执行类似于

的操作
$ mkvirtualenv drdigit_test $ pip install -r requirements/requirements_test.txt $ pytest

drdigit克隆的目录。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android:在ListView上使用setOnItemClickListener   使用Netbeans 7.0连接到SQL Server的java正在挂起   java Spring3依赖项注入不适用于mule   java Flink SQL结果字段与LocalDateTime上请求的类型错误不匹配   java找不到文件的结尾   考虑到NamingStrategy,java有没有办法将字符串转换为JsonNode?   使用Netbeans/ant部署java(命令行)应用程序   java如何修复Spring引导多部分上载中的“所需请求部分不存在”   java在应用程序启动时通过引用获取映射未知目标实体属性异常   java形状旋转问题Java2d   Weblogic服务器上的java ExecuteAndWaitInterceptor问题   JavaSpringBoot:project将图像保存在错误的路径中,并且在使用IDEIntellji打开时不显示图像   类向java接口添加方法   Swing组件上的Java 7泛型   sql server如何从java获取用户名。sql。联系   java如何检查该行是否与正则表达式(regex)冲突?   java如何在spring引导安全中为计数失败登录设置验证登录为false   图像如何在Java中使PNG的白色透明?