MARS 和 GAM 等模型是否假设异方差和 IID 误差?文献中似乎对某些假设存在分歧。看起来 MARS 比 GAM 更强大,但原始论文中没有明确说明。
如果正态性是一个问题,是否应该使用转换后的数据(Box-Cox 或 Yeo-Johnson)进行回归?
GAM 不假设条件正态性; “G”代表广义,表示这些模型建立在广义线性模型框架的基础上,传统上可以对数据进行建模,从指数分布族中绘制分布。
如果您用高斯条件分布拟合 GAM,那么该模型将假设条件正态性,但一般类别的 GAM 不会,因为人们可以为响应选择适当的分布。
高斯 GAM 还假设观测值是条件同方差的。其他响应分布暗示均值-方差关系;例如对于泊松响应分布,方差等于平均值,因此假设计数越大,方差越高。
GAM 确实假设观测值是独立同分布的; GEE、GLMM 和 GAMM 是放宽独立性假设的扩展。
MARS 最初通过 OLS 拟合,因此它会采用一般线性模型的一些假设,但通常使用某种形式的交叉验证来评估模型拟合。只要交叉验证方案反映了数据的属性,那么线性模型的经典假设就不会真正适用,因为您不依赖理论来进行推理。