美国政府应急小组

2024-05-16 10:46:49 发布

男 | 程序猿一只，喜欢编程写python代码。

您好

我在尝试使用scipychi2_contingency函数时遇到了一些问题。

为了清楚起见，我想测试两个变量的独立性。我有两个文件包含相同数量的标记（从0到20），我提到的两个变量是从这些文件中提取的。
为此，我这样做：

data1 = np.array(datalist1)
data2 = np.array(datalist2)
if(len(data1) == len(data2)) :
    bins1 = np.arange(0, 20.001, 20/nbclasses1)
    bins1[len(bins1) - 1] += 1
    data1, bins1 = np.histogram(data1, bins1)
    bins2 = np.arange(0, 20.001, 20/nbclasses2)
    bins2[len(bins2) - 1] += 1
    data2, bins2 = np.histogram(data2, bins2)
    data = [data1, data2]
    chi2, pvalue, dof, a = chi2_contingency(data)
    # valeur du chi2
    self.statdetest_val.config(text = chi2)
    self.valcrit_val.config(text = pvalue)
    if(seuil_alpha > pvalue) :
        #null hypothesis rejected -> dependence 
    else :
        #null hypothesis accepted -> independence

因此，我试图通过将值重新组合到类中来测试这两个变量之间的独立性（如果我想要20个类，我将拥有0到1个类，1到2个类，…）。对于每个类，我计算内部值的数量，得到一个数组，其中包含每个类的标记数。
当两个变量的数目不同时，选择两个变量我想我不太了解如何使用这个函数，所以也许有人可以向我解释为什么我所做的不起作用？你认为我想做的事有可能吗？
提前谢谢！在

Tags：文件函数标记数量 len np 独立性个类

0条回答

目前没有回答

美国政府应急小组

相关问题更多 >

编程相关推荐

热门问题

热门文章

美国政府应急小组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >