我想确定在与其他协变量的多元回归中检测两个连续变量(比例)的相互作用项的影响所必需的样本量。
我们发现了以前的较小研究失败的影响。这些影响很小,但一位审阅者问我们说以前的研究可能动力不足,并提供了一些措施来支持这一点。
我正在使用pwr.f2.test()
包中的pwr
函数,如下所示:
pwr.f2.test(u = nominator, v = denominator, f2 = effect size, sig.level = 0.05, power = 0.8)
,并且将分母设置为NULL,以便获得样本大小。
这是我从summary()
输出的模型:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -21.2333 20.8127 -1.02 0.30800
age 0.0740 0.0776 0.95 0.34094
wkdemand 1.6333 0.5903 2.77 0.00582 **
hoops 0.8662 0.6014 1.44 0.15028
wtlift 5.2417 1.3912 3.77 0.00018 ***
height05 0.2205 0.0467 4.72 2.9e-06 ***
amtRS 0.1041 0.2776 0.37 0.70779
allele1_numS -0.0731 0.2779 -0.26 0.79262
amtRS:allele1_numS 0.6267 0.2612 2.40 0.01670 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 7.17 on 666 degrees of freedom
Multiple R-squared: 0.0769, Adjusted R-squared: 0.0658
F-statistic: 6.94 on 8 and 666 DF, p-value: 8.44e-09
和modelEffectSizes()
包中lmSupport
函数的模型效果大小估计:
Coefficients
SSR df pEta-sqr dR-sqr
(Intercept) 53.5593 1 0.0016 NA
age 46.7344 1 0.0014 0.0013
wkdemand 393.9119 1 0.0114 0.0106
hoops 106.7318 1 0.0031 0.0029
wtlift 730.5385 1 0.0209 0.0197
height05 1145.0394 1 0.0323 0.0308
amtRS 7.2358 1 0.0002 0.0002
allele1_numS 3.5599 1 0.0001 0.0001
amtRS:allele1_numS 296.2219 1 0.0086 0.0080
Sum of squared errors (SSE): 34271.3
Sum of squared total (SST): 37127.3
问题:
我在pwr.f2.test()
的f2插槽中输入什么值?我认为分子将为1,我应该使用modelEffectSizes()
中的pEta-sqr,所以在这种情况下为0.0086?
而且,我得到的估计样本量通常比我们的样本量675大得多–这是否意味着我们很幸运地获得了显着效果(鉴于规模效应)?请注意,我对不同事物有多种衡量标准,都指向同一个发现,因此我对此比较满意。
我将什么值放在pwr.f2.test()的f2插槽中?
对于pwr
的每个功能,请输入四个数量中的三个(效果大小,样本大小,有效水平,功效),第四个将是计算(1)。在pwr.f2.test
中,u
和v
是分子和分母的自由度。并且f2
用作效果大小量度。 例如,您将在其中放置一个效果大小估算值。
pEta-sqr是否使用正确的“效果大小”?
现在,有许多不同的效果大小度量。 Pwr
特别使用Cohen的F 2,它与pEta-sqr不同,因此我不推荐使用。
我可以使用哪种效果量度?
如@ 42-所述,您可以尝试使用delta-R 2效果,该效果在您的输出变量中标记为“ dR-sqr”。您可以使用Cohen f [2测量局部效果大小的变化来做到这一点,该变化由Selya et al。(2012)描述。它使用以下公式:
在等式中,B是相关变量,A是所有其他变量的集合,R 2 AB是方差由< [A和B一起(相对于没有回归变量的模型),R²A是由[[A(相对于没有回归变量的模型)解释的方差比例。我会按照@ 42-的建议进行操作-例如建立两个模型,一个具有交互作用,一个不具有交互作用,并使用其delta-R 2效果大小。
重要的是,正如@ 42-正确指出的那样,如果审阅者问您以前的研究是否能力不足,您需要使用这些研究的样本量来进行任何功效计算。如果您使用自己的研究参数,首先,您已经知道答案了–您确实有足够的能力检测差异,其次,您是事后进行的,这听起来也不正确。https://www.statmethods.net/stats/power.html