我们正在尝试寻找四个不同城市(BKI、DAUS、SRINA 和 PALLA)土壤有毒元素与表观遗传年龄加速之间的关联。我们使用ICP-MS测量了土壤有毒元素,并用实际年龄回归后计算了表观遗传年龄加速。我们总共使用了 10 种有毒元素。
但是,我面临两个问题: 1.四个城市的参加人数各不相同:BKI(1000名参加者)、DAUS(250名参加者)、SRINA(200名参加者)、PALLA(100名参加者)。我应该如何解释这些不同数量的人?
2.我们想要测量所有 10 种有毒元素与每个城市表观遗传年龄的关联。
目前,我正在使用下面的模型,但它提供了所有元素与表观遗传年龄加速之间的关联。我们也希望根据城市分开输出。
library("QuantPsyc")
data <- read.table("clr.clean.file2.txt", header=T, sep=",")
modal1 <- lm (epigenetic_age_acceleration ~
As + Se + Fe + Co + Zn + Mn + Hg + Sb + Mo + Pb +
Smoking_Status + Sex + Age, data = data)
modal1
modal1.stat<-lm.beta (modal1)
modal1.stat
As
0.0256056478741109
Se
0.00499178037586947
Fe
0.00210283404005497
Co
-0.00916637143431217
Zn
0.0639371964557919
Mn
-0.0213600659139311
Hg
0.0328431516176923
Sb
0.000169338014091565
Mo
-0.0200956999960768
suggested code work of me;
IEAA_elements <- lm (epigentic_age_acceleration ~ 0 + city +
city:(As +Se + Fe + Co + Zn +Mn + Hg + Sb+ Mo +Pb +
Smoking_Status + Sex + Age), data = data)
cf <- confint(IEAA_elements)
cf
现在不确定如何将置信区间与回归输出合并?
假设
city
是数据集中的一个分类(因子)变量,您可能想要:
epigenetic_age_acceleration ~
0 + city + city:(As + Se + Fe + Co + Zn + Mn + Hg + Sb + Mo + Pb +
Smoking_Status + Sex + Age)
0+city
表示为每个城市安装单独的拦截(并抑制整体拦截)。 city:(<stuff>)
表示适合 city
和 <stuff>
之间的 交互。
您通常不需要明确考虑不同城市中样本的不同强度:这将由回归框架处理。