如果仅使用X和y,则可以写y = mx + c方程进行线性回归。
但是现在我还有另外两个变量。所以现在我有4个变量。
让我们以“ x,y,z,w”作为我的4个变量。如何写方程式?如果使用线性回归,则可以使用y = mx + c公式。但只会代表x和y。但我想将所有x,y,z和w都合并到一个公式中。
等式是什么?
这里有几件事需要清除:
使用单个预测变量(“独立变量”)的线性回归有时称为simple linear regression。
但是,公式“ $ y = mx + c $”不能正确描述$ y $和$ x $之间的关系;可能没有y值位于$ mx + c $行上,因此我们需要其他说明值之间的关系。
我们可能会写$ y = mx + c + \ epsilon $(通常使用$ \ epsilon $为零均值误差项)来描述$ y $与$ x $数据,或者我们可以放$ E(Y | x)= mx + c $,其中$ Y $是我们在< [$ x $和$ E $是它的期望。在这两种情况下,$ m $和$ c $不是我们估计的斜率和截距,而是估计的数量。
linear通常是指参数中的线性,其中“线性”是指其在linear algebra中的含义,而不是在(例如)演算或线性多项式中。
$ y = \ beta_0 + \ beta_1 x_1 + \ beta_2 x_2 + \ beta_3 x_3 + ... + \ beta_p x_p + \ epsilon $
$ y = c + m_xx + m_ww + m_zz + \ epsilon $
(回到您的表示法,但根据需要对其进行扩展)。具有两个预测变量,拟合关系$ \ hat {y} = \ hat {\ beta} _0 + \ hat {\ beta} _1x_1 + \ hat {\ beta} _2x_2 + e $
是一个平面,且更多的预测变量最终会产生相关维数的超平面。在我们通常在统计中使用术语的意义上,这都是“线性回归”。$ y = \ beta_0 + \ beta_1x + g_1(w )+ g_2(z)+ \ epsilon $
我们网站上的许多帖子都讨论了多元回归。尝试标记multiple-regression