我已经调用了python上的KS test函数来比较两个特性:大小和持续时间,我在解释输出时有点不知所措。这是我的代码:
from scipy.stats import ks_2samp
import csv
ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)
print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)
我把这个作为输出:
size: | (0.25583333333333336, 0.0039023335557401583)
Duration: | (0.11504409325067666, 0.092596990959821421)
我从KS测试的scipy网页上知道,第一个是统计值,第二个是p值。但是如何从这些值中准确地解释哪个特性更好呢??在
KS检验与一个无效假设相关:被比较的组是从同一总体中抽样的。在
如果零假设成立,p值就是观察到样本组之间特定偏差的概率。在
对于尺寸,观察到的偏差水平预计为0.3%的样本运行。在
在持续时间内,9%的时间可以看到偏差水平。在
什么功能更好?如果任务是试图区分一个群体和另一个群体,规模可能会更好。在
相关问题 更多 >
编程相关推荐