Kolmogorov–Smirnov tes的Scipy输出

2024-06-16 11:09:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经调用了python上的KS test函数来比较两个特性:大小和持续时间,我在解释输出时有点不知所措。这是我的代码:

from scipy.stats import ks_2samp
import csv

ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)

print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)

我把这个作为输出:

size: | (0.25583333333333336, 0.0039023335557401583)

Duration: | (0.11504409325067666, 0.092596990959821421)

我从KS测试的scipy网页上知道,第一个是统计值,第二个是p值。但是如何从这些值中准确地解释哪个特性更好呢??在


Tags: csvimportsizescipy特性printksds1
1条回答
网友
1楼 · 发布于 2024-06-16 11:09:14

KS检验与一个无效假设相关:被比较的组是从同一总体中抽样的。在

如果零假设成立,p值就是观察到样本组之间特定偏差的概率。在

对于尺寸,观察到的偏差水平预计为0.3%的样本运行。在

在持续时间内,9%的时间可以看到偏差水平。在

什么功能更好?如果任务是试图区分一个群体和另一个群体,规模可能会更好。在

相关问题 更多 >