在用于推理统计的线性模型中是否应该使用不平衡变量作为自变量?

问题描述 投票:0回答:1

嘿嘿,

情况:我正在尝试创建一个线性(混合)模型。我从之前的研究中知道,一个人的性别和疾病严重程度会影响结果变量。我感兴趣的变量称为治疗。我计划使用似然比检验来测试治疗效果。

问题:我现在正在分析的研究不太平衡:

  • 所有参与者中33%是女性,67%是男性
  • 女性的疾病严重程度高于男性
  • 33% 的女性和 50% 的男性接受了该药物治疗。

问题

  • 在用于推理统计的线性(混合)模型中,性别是否应该被视为自变量?
  • 由于共线性,是否应该避免包含这两个变量,并且性别可以“涵盖两者”,即疾病和性别特异性(混杂)效应?

我对性别和疾病严重程度对结果的影响并不直接感兴趣,因为我的重点是治疗对结果的影响,我主要感兴趣的是创建一个具有医学和统计意义的模型。

非常感谢你:)

r statistics regression lme4 mixed-models
1个回答
0
投票

性别是否应该被视为用于推理统计的线性(混合)模型中的自变量?

由于共线性,是否应该避免包含这两个变量,并且性别可以“涵盖两者”,即疾病和性别特异性(混杂)效应?

通常,性别作为回归变量包含在回归模型中,因为它是一个潜在的混杂因素。性别通常与结果和主要暴露都有因果关系,所以是的,如果这可能出现在您的研究中,那么应该将其包括在内。设计不平衡并不重要——混合模型能够处理这个问题。仅当相关性极高时,多重共线性才会成为问题。我们预计存在一定程度的相关性。

我建议绘制一个 DAG 来确定要包含/排除哪些变量。请参阅此主题以了解如何以及为何这样做的详细信息:
DAG 如何帮助减少因果推理中的偏差?

© www.soinside.com 2019 - 2024. All rights reserved.