我对此页面中的示例有疑问 https://asdfree.com/national-health-and-nutrition-examination-survey-nhanes.html
我注意到作者在这一步中创建调查对象之前已经对数据进行了子集化
nhanes_df <- subset( nhanes_full_df , ridstatr %in% 2 )
这不会导致标准误错误吗?
所以你绝对正确的是在之前进行子集化
svydesign
通常会导致不正确的方差估计。 我相信您永远不想在 svydesign
运行之前丢弃 weighted记录。
但是,在这个 nhanes 示例中,您正在查看区分受访者的变量
实际上两个不同的组有不同的权重——所以在这种非标准情况下,在
svydesign()
:-) 之前进行子集化是正确的
谢谢并保持联系
https://wwwn.cdc.gov/Nchs/Nhanes/2017-2018/DEMO_J.htm
RIDSTATR
WTMEC2YR
WTINT2 年