Python包质量覆盖C++扩展

quality-covers的Python项目详细描述


质量保证书

质量覆盖是一种模式挖掘算法。在

安装

pip3 install --upgrade quality_covers

事务性文件

如果你的文件是这样的

在象棋.dat公司名称:

^{pr2}$

或者

P30968
P48551 P17181
P05121 Q03405 P00747 P02671
Q02643
P48551 P17181

使用

importquality_coversquality_covers.run_classic_size("chess.dat",False)

二进制文件

如果你的文件是这样的

在象棋数据公司名称:

1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 1 0 0 1
1 0 1 0 1 0 0 1 1 0
1 0 1 0 0 1 1 0 1 0
1 0 1 0 0 1 0 1 1 0

使用

importquality_coversquality_covers.run_classic_size("chess.data",True)

功能输出

函数将在当前目录中创建两个文件:

  • 国际象棋数据输出:结果文件
  • 国际象棋数据时钟:关于时间执行的信息

提取二元矩阵

您可以通过对输出文件调用extract_binary_matrices来获得二进制矩阵

quality_covers.extract_binary_matrices('chess.data.out')

可选参数

阈值覆盖

您可以提供覆盖范围的阈值。在

# 60% of coveragequality_covers.run_classic_size("chess.data",True,0.6)

措施

您还可以询问有关度量的信息:

  • 频率
  • 单眼镜
  • 分离
  • 物体均匀性
quality_covers.run_classic_size("chess.data",True,0.6,True)
3,4,9 ; 4,5,6,7,8#Object Uniformity=0.81944; Monocole=91.00000; Frequency=0.33333; Separation=0.48387
2,9 ; 1,3,7#Object Uniformity=0.68750; Monocole=28.00000; Frequency=0.22222; Separation=0.27273
1,6,9 ; 2,7#Object Uniformity=0.63889; Monocole=28.00000; Frequency=0.33333; Separation=0.31579
# Mandatory: 0
# Non-mandatory: 3
# Total: 3
# Coverage: 25/38(65.78947%)
# Mean frequency: 0.29630
# Mean monocole: 49.00000
# Mean object uniformity: 0.71528
# Mean separation: 0.35746

不同的算法

目前有四种不同的算法:

  • run_classic_size
  • run_approximate_size
  • run_fca_cemb_with_mandatory
  • run_fca_cemb_without_mandatory

示例

具有80%覆盖率的事务性文件,并使用近似大小算法测量信息

数据文件

1 3 5 7 10 
1 3 5 7 10 
1 3 5 8 9 
1 3 6 7 9 
1 3 6 8 9 
1 4 5 7 10 
1 4 5 7 10 
1 4 5 8 9 
1 4 6 7 9 
1 4 6 8 9 
2 3 5 7 10 
2 3 5 7 10 
2 3 5 8 9 
2 3 6 7 9 
2 3 6 8 9 
2 4 5 7 10 
2 4 5 7 10 
2 4 5 8 9 
2 4 6 7 9 
2 4 6 8 9 

Python命令

importquality_coversquality_covers.run_approximate_size(file.data', True, 0.8, True)

结果file.data.out文件

1,2,6,7,11,12,16,17 ; 5,7,10#Object Uniformity=0.60000; Monocle=648.00000; Frequency=0.40000; Separation=0.50000
4,5,9,10,14,15,19,20 ; 9,6#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
3,5,8,10,13,15,18,20 ; 8,9#Object Uniformity=0.40000; Monocle=352.00000; Frequency=0.40000; Separation=0.36364
11,12,13,14,15,16,17,18,19,20 ; 2#Object Uniformity=0.20000; Monocle=228.00000; Frequency=0.50000; Separation=0.20000
6,7,8,9,10,16,17,18,19,20 ; 4#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
1,2,3,4,5,11,12,13,14,15 ; 3#Object Uniformity=0.20000; Monocle=258.00000; Frequency=0.50000; Separation=0.20000
# Mandatory: 0
# Non-mandatory: 6
# Total: 6
# Coverage: 82/100(82.00000%)
# Mean frequency: 0.45000
# Mean monocle: 349.33334
# Mean object uniformity: 0.33333
# Mean separation: 0.30455

提取二元矩阵

importquality_coversquality_covers.extract_binary_matrices('file.data.out')

结果二元矩阵范围

1 0 0 0 0 1
1 0 0 0 0 1
0 0 1 0 0 1
0 1 0 0 0 1
0 1 1 0 0 1
1 0 0 0 1 0
1 0 0 0 1 0
0 0 1 0 1 0
0 1 0 0 1 0
0 1 1 0 1 0
1 0 0 1 0 1
1 0 0 1 0 1
0 0 1 1 0 1
0 1 0 1 0 1
0 1 1 1 0 1
1 0 0 1 1 0
1 0 0 1 1 0
0 0 1 1 1 0
0 1 0 1 1 0
0 1 1 1 1 0

结果二元矩阵范围

第一行是列的名称

5 7 10 9 6 8 2 4 3
1 1 1 0 0 0 0 0 0
0 0 0 1 1 0 0 0 0
0 0 0 1 0 1 0 0 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 1

更多信息

相关文件

即将到来

研究实验室

有关关联规则的更多工具

作者

阿米拉·穆阿克尔(amira.mouakher@u-bourgogne.fr) 尼古拉斯·格罗斯(nicolas.gros01@u-bourgogne.fr) 塞巴斯蒂安·格林(sebastien.gerin@sayens.fr

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android Studio:我的短信应用程序不是默认短信应用程序的选项之一   java处理字符串问题   java为什么我的程序打印“null”而不是字符串?   java为什么要创建一个无限循环?   java循环在一段时间后将布尔值更改为false?   java Android Rest Api Post 400错误请求   java调用另一个方法以获取resultset并正确关闭连接?   java我想在2d数组中添加一行   Java:我需要从outputstream中获取字节数组   C语言中Java元注释的等价物#   java如何在从web下载图像时保持原始图像的dpi?   java中基于输入值的spring boot动态值   java从请求中获取主机名   java可以复制Swing代码并在intelliJ中的designer中查看它吗   spring如何使用java配置多个ldap   安卓如何在Java中使用具有多个类似参数的JSON请求/响应循环?   java LIbGDX如何在语言更改时翻译所有文本?