Python包质量覆盖C++扩展

quality-covers的Python项目详细描述


质量保证书

质量覆盖是一种模式挖掘算法。在

安装

pip3 install --upgrade quality_covers

事务性文件

如果你的文件是这样的

在象棋.dat公司名称:

^{pr2}$

或者

P30968
P48551 P17181
P05121 Q03405 P00747 P02671
Q02643
P48551 P17181

使用

importquality_coversquality_covers.run_classic_size("chess.dat",False)

二进制文件

如果你的文件是这样的

在象棋数据公司名称:

1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 0 1 1 0
1 0 1 0 0 1 1 0 1 0
1 0 1 0 0 1 0 1 1 0

使用

importquality_coversquality_covers.run_classic_size("chess.data",True)

功能输出

函数将在当前目录中创建两个文件:

  • 国际象棋数据输出:结果文件
  • 国际象棋数据时钟:关于时间执行的信息

提取二元矩阵

您可以通过对输出文件调用extract_binary_matrices来获得二进制矩阵

quality_covers.extract_binary_matrices('chess.data.out')

可选参数

阈值覆盖

您可以提供覆盖范围的阈值。在

# 60% of coveragequality_covers.run_classic_size("chess.data",True,0.6)

措施

您还可以询问有关度量的信息:

  • 频率
  • 单眼镜
  • 分离
  • 物体均匀性
quality_covers.run_classic_size("chess.data",True,0.6,True)
3,4,9 ; 4,5,6,7,8#Object Uniformity=0.81944; Monocole=91.00000; Frequency=0.33333; Separation=0.48387
2,9 ; 1,3,7#Object Uniformity=0.68750; Monocole=28.00000; Frequency=0.22222; Separation=0.27273
1,6,9 ; 2,7#Object Uniformity=0.63889; Monocole=28.00000; Frequency=0.33333; Separation=0.31579
# Mandatory: 0
# Non-mandatory: 3
# Total: 3
# Coverage: 25/38(65.78947%)
# Mean frequency: 0.29630
# Mean monocole: 49.00000
# Mean object uniformity: 0.71528
# Mean separation: 0.35746

不同的算法

目前有四种不同的算法:

  • run_classic_size
  • run_approximate_size
  • run_fca_cemb_with_mandatory
  • run_fca_cemb_without_mandatory

示例

具有80%覆盖率的事务性文件,并使用近似大小算法测量信息

数据文件

1 3 5 7 10 
1 3 5 7 10 
1 3 5 8 9 
1 3 6 7 9 
1 3 6 8 9 
1 4 5 7 10 
1 4 5 7 10 
1 4 5 8 9 
1 4 6 7 9 
1 4 6 8 9 
2 3 5 7 10 
2 3 5 7 10 
2 3 5 8 9 
2 3 6 7 9 
2 3 6 8 9 
2 4 5 7 10 
2 4 5 7 10 
2 4 5 8 9 
2 4 6 7 9 
2 4 6 8 9 

Python命令

importquality_coversquality_covers.run_approximate_size(file.data', True, 0.8, True)

结果file.data.out文件

1,2,6,7,11,12,16,17 ; 5,7,10#Object Uniformity=0.60000; Monocle=648.00000; Frequency=0.40000; Separation=0.50000
4,5,9,10,14,15,19,20 ; 9,6#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
3,5,8,10,13,15,18,20 ; 8,9#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
11,12,13,14,15,16,17,18,19,20 ; 2#Object Uniformity=0.20000; Monocle=228.00000; Frequency=0.50000; Separation=0.20000
6,7,8,9,10,16,17,18,19,20 ; 4#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
1,2,3,4,5,11,12,13,14,15 ; 3#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
# Mandatory: 0
# Non-mandatory: 6
# Total: 6
# Coverage: 82/100(82.00000%)
# Mean frequency: 0.45000
# Mean monocle: 349.33334
# Mean object uniformity: 0.33333
# Mean separation: 0.30455

提取二元矩阵

importquality_coversquality_covers.extract_binary_matrices('file.data.out')

结果二元矩阵范围

1 0 0 0 0 1
1 0 0 0 0 1
0 0 1 0 0 1
0 1 0 0 0 1
0 1 1 0 0 1
1 0 0 0 1 0
1 0 0 0 1 0
0 0 1 0 1 0
0 1 0 0 1 0
0 1 1 0 1 0
1 0 0 1 0 1
1 0 0 1 0 1
0 0 1 1 0 1
0 1 0 1 0 1
0 1 1 1 0 1
1 0 0 1 1 0
1 0 0 1 1 0
0 0 1 1 1 0
0 1 0 1 1 0
0 1 1 1 1 0

结果二元矩阵范围

第一行是列的名称

5 7 10 9 6 8 2 4 3
1 1 1 0 0 0 0 0 0
0 0 0 1 1 0 0 0 0
0 0 0 1 0 1 0 0 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 1

更多信息

相关文件

即将到来

研究实验室

有关关联规则的更多工具

作者

阿米拉·穆阿克尔(amira.mouakher@u-bourgogne.fr) 尼古拉斯·格罗斯(nicolas.gros01@u-bourgogne.fr) 塞巴斯蒂安·格林(sebastien.gerin@sayens.fr

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JavaFX触控事件未触发Ubuntu 20.04触控笔记本电脑   java如何在AWT中关闭窗口?   java Dagger 2:注入具有构造函数参数的成员   创建对象的Java调用类   对象我想在A.java中添加两个数字,并在B.java中打印结果(如何?)   java如何使用AWS SDK for Android从数字海洋空间下载图像?   java Facebook sdk 4.0.1无法使用Android studio获取某些字段   4分钟后web应用程序(Angular 8和Rest API)中的java自动会话超时   在Eclipse for Java EE developers edition中禁用HTML警告   java按字母顺序排列字符串我错过了什么明显的东西吗?   java在Jshell中println和printf有什么不同