在交互中使用weightthem - ebal(R统计)作为治疗是否可行?

问题描述 投票:0回答:1

我试图找出在特定学校类型中接受治疗的学生与在任何其他学校类型中接受治疗的学生之间的结果是否存在差异。

我之前使用 PSM 来发现治疗对结果的影响 - 但由于治疗组(给定的接受治疗的学校类型)变得很小并且非常特殊(关于协变量),我想知道是否可以在权重中使用熵平衡-R 中的包(因为我也使用 MI 来处理缺失值)。首先,我考虑使用简化的数据集(仅处理所有学校类型),但我既没有通过 PSM 实现平衡,也没有 ebal 加权收敛。一种可能性可能是减少协变量的数量以增加重叠,但条件独立假设可能会出现问题。

所以现在我正在使用完整的数据集(大多数学生未经治疗)。

我的看法是

加权数据<- weightthem(Given-schooltype*Treatment ~ X1 + X2+ X3+ Xn, imputed.data, approach = "within", method = "ebal", estimand = "ATT").

到目前为止我的问题: 尝试在交互时刻平衡数据集是否有意义? 后续分析会是什么样子?我正在考虑结果回归〜给定学校类型+治疗+给定学校类型*治疗(也许还有进一步的控制?)

提前致谢!

编辑:处理是二进制的(0/1),给定的学校类型也是二进制虚拟的(0/1)。

编辑2(回复/澄清/答案): 嘿,谢谢你的回复!您的回答(和问题)已经非常帮助我澄清了一些事情! 按照你写的方式,我发现为了回答我的 RQ,我应该使用仅包含处理单位(给定类型 x 处理)和未处理单位(其他类型 x 处理)的样本,因为我正在寻找 ATT。所以我只有二元治疗。 实际上,我可能无法找到足够的平衡,因为如上所述,特定学校类型的学生或多或少享有特权。所以我可能无法按照我想要的方式进行分析。对于我的论文来说,这将是相当灾难性的,但就其本身而言,这将是一个有趣的发现,我将进一步研究。

我尝试了不同的方法(PSM、基因匹配;ebal)。实际上,之后的平衡并不算太差,但我的有效样本量变得非常小,所以我不想在这些样本中得出推论。我会按照您的建议尝试进一步的方法:)

我的同事们(我实际上也相信他们在统计分析方面有一些基础知识)建议在完整样本中进行回归分析,其中包含主效应(学校类型、治疗)、交互项(学校类型) *治疗)和控制变量(将用于加权)。但我认为这不是最好的方法(甚至不是一种合理的方法,因为我的大多数样本都没有接受治疗(但就读了给定的学校类型))。

进一步注意的是,我使用非实验纵向数据,因此我有治疗的预处理值(但不是给定学校类型的录取 - 这些我只能近似,但还不错)。

r weighted entropy propensity-score-matching
1个回答
0
投票

听起来您有 4 类处理,您可以使用

weightit()
与熵平衡一起使用(
weightit()
weightthem()
背后的引擎,包含所有有关可能的文档;
weightthem()
只是运行
 weightit()
在每个估算数据集上)。只需创建 4 类变量并将其作为模型公式中的处理即可。

我还发现你似乎只关心比较两组学生;在一种学校类型中接受治疗的人和在另一种学校类型中接受治疗的人。那么您实际上有 4 类治疗,还是只有 2 类治疗?未经治疗的学生应该如何参与此分析?

熵平衡每个组的权重以类似于目标。默认情况下,它对每个组进行加权以类似于完整样本。您希望每个组都类似于完整样本、仅处理过的单元还是仅 4 个类别之一?你需要做出决定。它可能会对您实现平衡的能力、估计效果及其解释产生重大影响。这由

estimand
参数和样本中包含的单位控制。

如果熵平衡由于平衡约束太严格而失败,只需使用不同的方法即可。

weightit()
还有其他几种可能适用于您的数据集的方法。您尝试过倾向得分加权吗?你尝试过CBPS吗?你尝试过能量平衡吗?如果没有方法可以平衡您的数据集,那么它可能无法平衡,并且您拥有根本上无法比较的组。那你会做什么?

© www.soinside.com 2019 - 2024. All rights reserved.