我想知道使用固定因子和随机因子是否可以接受。我的理解是这不是一般做法。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3881361/
http://avesbiodiv.mncn.csic.es/estadistica/curso2011/regm26.pdf
在下面的模型中,我使用
Sp
作为固定因子和随机因子,并且我的模型不收敛。
Model1 <- lmer (C1 ~ Place*Voicing*Length*Sp +
(1+Place+Voicing+Length|Sp),data =
C1,control=lmerControl(optCtrl=list(maxfun=50000)))
anova (Model1)
str(LME_Model1)
$ Sp : Factor w/ 5 levels
$ Place : Factor w/ 3 levels
$ Voicing : Factor w/ 2 levels
$ Length : Factor w/ 2 levels
Warning messages:
1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :
unable to evaluate scaled gradient
2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :
Model failed to converge: degenerate Hessian with 4 negative eigenvalues
如果我从固定因子中排除
Sp
,则模型收敛。
有人可以解释一下使用 Sp
作为固定因子是否可以吗?
你想要拟合的模型理论上可以,但实际上很难。
更准确地说,当您说“包括固定和随机因素”时,您的意思是“包括固定因素和*作为特定分组变量中的术语”。我通常会将“包括
g
作为随机效应”解释为“包括 g
作为随机效应 分组变量”,即类似于 (1|g)
。
当您在模型中包含
(1+Place+Voicing+Length|Sp)
时,您假设的是 Place
、Voicing
和 Length
的效果允许在分组变量 (Sp
) 的不同级别上有所不同。鉴于您使用的是随机块设计(Sp
的每个或至少大多数级别都有对Place
、Voicing
和Length
的所有或大多数级别的观察),这种变异性理论上是可估计的。
但是......如果您想估计所有这些可变性,您通常需要进行大型实验。假设
Place
、Voicing
和 Length
分别具有 m1
、m2
和 m3
水平。 lme4
假设特定分组变量包含的所有项都可以共变;这意味着您将估计具有 1+m1+m2+m3-3 = m1+m2+m3-2
行和列(不同效应共享截距项)的方差-协方差矩阵,或者总共 (m1+m2+m3-2)*(m1+m2+m3-1)/2
方差-协方差参数 - 至少 10 个(如果这些参数是)每个两水平因子。
当混合模型在理论上是可识别的,但实际上没有足够的数据来拟合最大模型时,关于正确的程序存在很多争论。 here 给出了一些讨论。您可以拟合最大模型并以某种合理的顺序丢弃项,直到它不再过度指定为止;使用贝叶斯方法,指定先验来正则化模型;尝试在更简单的模型上决定先验...
除了上面给出的回复之外,我可以进一步向您推荐我的两篇文章“固定和随机水平因素的异方差误差项背景下的重复测量分析” https://doi.org /10.3390/stats5020027 和 “构建每个因子都具有固定水平和随机水平的线性混合模型:RCBD 中的分裂-分裂图结构的情况” 证明了将因子划分为同时具有两者的可能性固定和随机级别。