您知道,使用选项CORRB
,可以让SAS中的逻辑回归或线性回归输出估计矩阵的相关性。有趣的是,我不确定如何读取此矩阵。我有两个明显很强的正相关的变量。从PROC CORR
,我可以看到这两个变量的皮尔逊相关系数是0.7+
。但是从逻辑回归和线性回归得出的估计矩阵都为-0.7。相关强度大约相似,但符号相反。有人可以解释吗?非常感谢。
您正确地读取了这些值,它们只是表示不同的含义。 PROC CORR为您提供了变量的相关性,而CORRB是模型中这些变量的系数的相关性。
这里是为什么正相关的预测变量将具有负相关系数的直观解释。假设y = a + b1*x1 + b2*x2 + eps
。如果将b1
从回归得到的最佳值稍微增加一点,则y
的预测值也会增加(对于正数x1
),会使整体拟合度变差。补偿该值并使预测值更接近于观察值的一种方法是decrease b2
:由于x1
的高值与x2
的高值相关联,您将回到接近原始的适合。这表明b2
中的不确定性与b1
中的不确定性呈负相关:增加一个而减少另一个将导致相似的拟合。
研究完全相关的极端情况可能是有益的:x2=x1
。然后,以下内容将为您提供完全相同的预测:
y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc
所以b2 = 5-b1
和系数具有完美的负相关。