美国政府应急小组

2024-05-16 10:46:49 发布

您现在位置:Python中文网/ 问答频道 /正文

您好

我在尝试使用scipychi2_contingency函数时遇到了一些问题。

为了清楚起见,我想测试两个变量的独立性。我有两个文件包含相同数量的标记(从0到20),我提到的两个变量是从这些文件中提取的。
为此,我这样做:

data1 = np.array(datalist1)
data2 = np.array(datalist2)
if(len(data1) == len(data2)) :
    bins1 = np.arange(0, 20.001, 20/nbclasses1)
    bins1[len(bins1) - 1] += 1
    data1, bins1 = np.histogram(data1, bins1)
    bins2 = np.arange(0, 20.001, 20/nbclasses2)
    bins2[len(bins2) - 1] += 1
    data2, bins2 = np.histogram(data2, bins2)
    data = [data1, data2]
    chi2, pvalue, dof, a = chi2_contingency(data)
    # valeur du chi2
    self.statdetest_val.config(text = chi2)
    self.valcrit_val.config(text = pvalue)
    if(seuil_alpha > pvalue) :
        #null hypothesis rejected -> dependence 
    else :
        #null hypothesis accepted -> independence


因此,我试图通过将值重新组合到类中来测试这两个变量之间的独立性(如果我想要20个类,我将拥有0到1个类,1到2个类,…)。对于每个类,我计算内部值的数量,得到一个数组,其中包含每个类的标记数。
当两个变量的数目不同时,选择两个变量 我想我不太了解如何使用这个函数,所以也许有人可以向我解释为什么我所做的不起作用?你认为我想做的事有可能吗?
提前谢谢!在


Tags: 文件函数标记数量lennp独立性个类