Python包质量覆盖C++扩展
quality-covers的Python项目详细描述
质量保证书
质量覆盖是一种模式挖掘算法。在
安装
pip3 install --upgrade quality_covers
事务性文件
如果你的文件是这样的
在象棋.dat公司名称:
^{pr2}$或者
P30968
P48551 P17181
P05121 Q03405 P00747 P02671
Q02643
P48551 P17181
使用
importquality_coversquality_covers.run_classic_size("chess.dat",False)
二进制文件
如果你的文件是这样的
在象棋数据公司名称:
1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 0 1 1 0
1 0 1 0 0 1 1 0 1 0
1 0 1 0 0 1 0 1 1 0
使用
importquality_coversquality_covers.run_classic_size("chess.data",True)
功能输出
函数将在当前目录中创建两个文件:
- 国际象棋数据输出:结果文件
- 国际象棋数据时钟:关于时间执行的信息
提取二元矩阵
您可以通过对输出文件调用extract_binary_matrices
来获得二进制矩阵
quality_covers.extract_binary_matrices('chess.data.out')
可选参数
阈值覆盖
您可以提供覆盖范围的阈值。在
# 60% of coveragequality_covers.run_classic_size("chess.data",True,0.6)
措施
您还可以询问有关度量的信息:
- 频率
- 单眼镜
- 分离
- 物体均匀性
quality_covers.run_classic_size("chess.data",True,0.6,True)
3,4,9 ; 4,5,6,7,8#Object Uniformity=0.81944; Monocole=91.00000; Frequency=0.33333; Separation=0.48387
2,9 ; 1,3,7#Object Uniformity=0.68750; Monocole=28.00000; Frequency=0.22222; Separation=0.27273
1,6,9 ; 2,7#Object Uniformity=0.63889; Monocole=28.00000; Frequency=0.33333; Separation=0.31579
# Mandatory: 0
# Non-mandatory: 3
# Total: 3
# Coverage: 25/38(65.78947%)
# Mean frequency: 0.29630
# Mean monocole: 49.00000
# Mean object uniformity: 0.71528
# Mean separation: 0.35746
不同的算法
目前有四种不同的算法:
run_classic_size
run_approximate_size
run_fca_cemb_with_mandatory
run_fca_cemb_without_mandatory
示例
具有80%覆盖率的事务性文件,并使用近似大小算法测量信息
数据文件
1 3 5 7 10
1 3 5 7 10
1 3 5 8 9
1 3 6 7 9
1 3 6 8 9
1 4 5 7 10
1 4 5 7 10
1 4 5 8 9
1 4 6 7 9
1 4 6 8 9
2 3 5 7 10
2 3 5 7 10
2 3 5 8 9
2 3 6 7 9
2 3 6 8 9
2 4 5 7 10
2 4 5 7 10
2 4 5 8 9
2 4 6 7 9
2 4 6 8 9
Python命令
importquality_coversquality_covers.run_approximate_size(file.data', True, 0.8, True)
结果file.data.out文件
1,2,6,7,11,12,16,17 ; 5,7,10#Object Uniformity=0.60000; Monocle=648.00000; Frequency=0.40000; Separation=0.50000
4,5,9,10,14,15,19,20 ; 9,6#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
3,5,8,10,13,15,18,20 ; 8,9#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
11,12,13,14,15,16,17,18,19,20 ; 2#Object Uniformity=0.20000; Monocle=228.00000; Frequency=0.50000; Separation=0.20000
6,7,8,9,10,16,17,18,19,20 ; 4#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
1,2,3,4,5,11,12,13,14,15 ; 3#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
# Mandatory: 0
# Non-mandatory: 6
# Total: 6
# Coverage: 82/100(82.00000%)
# Mean frequency: 0.45000
# Mean monocle: 349.33334
# Mean object uniformity: 0.33333
# Mean separation: 0.30455
提取二元矩阵
importquality_coversquality_covers.extract_binary_matrices('file.data.out')
结果二元矩阵范围
1 0 0 0 0 1
1 0 0 0 0 1
0 0 1 0 0 1
0 1 0 0 0 1
0 1 1 0 0 1
1 0 0 0 1 0
1 0 0 0 1 0
0 0 1 0 1 0
0 1 0 0 1 0
0 1 1 0 1 0
1 0 0 1 0 1
1 0 0 1 0 1
0 0 1 1 0 1
0 1 0 1 0 1
0 1 1 1 0 1
1 0 0 1 1 0
1 0 0 1 1 0
0 0 1 1 1 0
0 1 0 1 1 0
0 1 1 1 1 0
结果二元矩阵范围
第一行是列的名称
5 7 10 9 6 8 2 4 3
1 1 1 0 0 0 0 0 0
0 0 0 1 1 0 0 0 0
0 0 0 1 0 1 0 0 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 1
更多信息
相关文件
即将到来
研究实验室
有关关联规则的更多工具
- https://marm.checksem.fr/api/ui/
- https://app.marm.checksem.fr/
- https://quality-cover.checksem.fr/api/ui
作者
阿米拉·穆阿克尔(amira.mouakher@u-bourgogne.fr) 尼古拉斯·格罗斯(nicolas.gros01@u-bourgogne.fr) 塞巴斯蒂安·格林(sebastien.gerin@sayens.fr)
- 项目
标签: