您好
我在尝试使用scipychi2_contingency函数时遇到了一些问题。
为了清楚起见,我想测试两个变量的独立性。我有两个文件包含相同数量的标记(从0到20),我提到的两个变量是从这些文件中提取的。
为此,我这样做:
data1 = np.array(datalist1)
data2 = np.array(datalist2)
if(len(data1) == len(data2)) :
bins1 = np.arange(0, 20.001, 20/nbclasses1)
bins1[len(bins1) - 1] += 1
data1, bins1 = np.histogram(data1, bins1)
bins2 = np.arange(0, 20.001, 20/nbclasses2)
bins2[len(bins2) - 1] += 1
data2, bins2 = np.histogram(data2, bins2)
data = [data1, data2]
chi2, pvalue, dof, a = chi2_contingency(data)
# valeur du chi2
self.statdetest_val.config(text = chi2)
self.valcrit_val.config(text = pvalue)
if(seuil_alpha > pvalue) :
#null hypothesis rejected -> dependence
else :
#null hypothesis accepted -> independence
因此,我试图通过将值重新组合到类中来测试这两个变量之间的独立性(如果我想要20个类,我将拥有0到1个类,1到2个类,…)。对于每个类,我计算内部值的数量,得到一个数组,其中包含每个类的标记数。
当两个变量的数目不同时,选择两个变量
我想我不太了解如何使用这个函数,所以也许有人可以向我解释为什么我所做的不起作用?你认为我想做的事有可能吗?
提前谢谢!在
目前没有回答
相关问题 更多 >
编程相关推荐