svrepdesign函数中combined.weights参数的包文档指出:
(如果TRUE
已包含采样权重)。通常都是这种情况。repweights
这里的“包括”是什么意思?我还没有在网上找到指定
combined.weights = TRUE
的示例,并且根据 repweights
的正则表达式,采样权重实际上被包含为代表权重之一。仅举一个示例,this Question 中的代码指定了 repweights = "k4natwt.rep[1-9]+"
、weights = ~k4natwt
和 combined.weights = TRUE
。显然,采样权重(“k4natwt”)不包含在复制权重中(全部采用“k4natwt.repX”形式,其中 X 是某个整数)。因此,我认为“包含”意味着其他东西,但我不知道是什么。
函数自身的警告可能是一个线索。我正在分析与上面链接的问题相同的调查(尽管不是同一波),如果我尝试使用 combined.weights = FALSE
创建调查设计对象,我会收到以下警告:
Warning: Data look like combined weights: mean replication weight is 360.117082418768 and mean sampling weight is 360.02467073254
我可以猜测权重和复制权重的平均值是相关的,但我并不清楚为什么。
看Lumley的《复杂调查:使用R进行分析的指南》,我发现这样一段话:
选项combined.weights指定重复权重包括采样权重;另一种方法是它们需要乘以采样权重。
“包括”是否意味着“包括在他们的计算中”?这意味着可以仅根据设计创建重复权重,忽略采样权重,然后将所得的重复权重乘以采样权重,使它们“包含”采样权重?我觉得我正在接近真相,但仍然不确定。
那么,
combined.weights
的确切含义是什么?我如何知道对于给定的调查,TRUE 或 FALSE 是否合适?
combined.weights=TRUE
是默认值,因此无需提供它,这可能就是为什么您找不到明确使用它的示例的原因。
combined.weights=TRUE
表示
repweights
参数是复制权重; combined.weights=FALSE
表示重复权重是 repweights
参数乘以采样权重。