要获得the correlation between two arrays in python,我使用:
from scipy.stats import pearsonr
x, y = [1,2,3], [1,5,7]
cor, p = pearsonr(x, y)
但是,正如the docs中所述,pearsonr()
返回的p值只对大于500的数据集有意义。那么如何才能得到一个对小数据集来说合理的p值呢?在
我的临时解决方案:
读完线性回归之后,我想出了我自己的小脚本,它基本上使用Fischer transformation来获得z分数,从中计算p值:
^{pr2}$它起作用了。但是,我不确定pearsonr()
给出的p值是否更合理。是否有一个python模块已经具有此功能?我在SciPy或{a5}找不到它。在
编辑以澄清:
在我的示例中,数据集是简化的。我真正的数据集是两个10-50值的数组。在
目前没有回答
相关问题 更多 >
编程相关推荐