是否有python(scipy)函数来确定获得目标功率所需的参数?

2024-04-30 02:25:12 发布

您现在位置:Python中文网/ 问答频道 /正文

在R中有一个非常有用的函数,它有助于确定双边t检验的参数,以获得目标统计功率。

函数名为power.prop.test

http://stat.ethz.ch/R-manual/R-patched/library/stats/html/power.prop.test.html

您可以使用以下方法调用它:

power.prop.test(p1 = .50, p2 = .75, power = .90)

它会告诉你获得这种能量所需的样本量。这在确定测试样本量时非常有用。

scipy包中有类似的功能吗?


Tags: 函数testhttp目标参数htmlchmanual
3条回答

一些基本的功率计算现在可以在statsmodels中获得

http://statsmodels.sourceforge.net/devel/stats.html#power-and-sample-size-calculationshttp://jpktd.blogspot.ca/2013/03/statistical-power-in-statsmodels.html

博客文章还没有考虑到statsmodels代码的最新更改。另外,我还没有决定要提供多少包装器函数,因为许多功率计算只是减少到基本分布。

>>> import statsmodels.stats.api as sms
>>> es = sms.proportion_effectsize(0.5, 0.75)
>>> sms.NormalIndPower().solve_power(es, power=0.9, alpha=0.05, ratio=1)
76.652940372066908

在R统计中

> power.prop.test(p1 = .50, p2 = .75, power = .90)

     Two-sample comparison of proportions power calculation 

              n = 76.7069301141077
             p1 = 0.5
             p2 = 0.75
      sig.level = 0.05
          power = 0.9
    alternative = two.sided

 NOTE: n is number in *each* group 

使用R的pwr

> library(pwr)
> h<-ES.h(0.5,0.75)
> pwr.2p.test(h=h, power=0.9, sig.level=0.05)

     Difference of proportion power calculation for binomial distribution (arcsine transformation) 

              h = 0.5235987755982985
              n = 76.6529406106181
      sig.level = 0.05
          power = 0.9
    alternative = two.sided

 NOTE: same sample sizes 

我已经使用下面的n公式和scipy.stats中的逆生存函数norm.isf成功地复制了这个函数

enter image description here

from scipy.stats import norm, zscore

def sample_power_probtest(p1, p2, power=0.8, sig=0.05):
    z = norm.isf([sig/2]) #two-sided t test
    zp = -1 * norm.isf([power]) 
    d = (p1-p2)
    s =2*((p1+p2) /2)*(1-((p1+p2) /2))
    n = s * ((zp + z)**2) / (d**2)
    return int(round(n[0]))

def sample_power_difftest(d, s, power=0.8, sig=0.05):
    z = norm.isf([sig/2])
    zp = -1 * norm.isf([power])
    n = s * ((zp + z)**2) / (d**2)
    return int(round(n[0]))

if __name__ == '__main__':

    n = sample_power_probtest(0.1, 0.11, power=0.8, sig=0.05)
    print n  #14752

    n = sample_power_difftest(0.1, 0.5, power=0.8, sig=0.05)
    print n  #392

马特得到所需n(每组)的答案几乎是正确的,但有一个小错误。

给定d(均值差)、s(标准差)、sig(显著性水平,通常为0.05)和幂(通常为0.80),计算每组观察数的公式为:

n= (2s^2 * ((z_(sig/2) + z_power)^2) / (d^2)

从他的公式中可以看出

n = s * ((zp + z)**2) / (d**2)

“s”部分是错误的。再现r的功能的正确函数是:

def sample_power_difftest(d, s, power=0.8, sig=0.05):
    z = norm.isf([sig/2]) 
    zp = -1 * norm.isf([power])
    n = (2*(s**2)) * ((zp + z)**2) / (d**2)
    return int(round(n[0]))

希望这有帮助。

相关问题 更多 >