在R中,如何解释glmnet包中的图?

问题描述 投票:1回答:1

我正在尝试了解“ glmnet”软件包。但是我仍然有一些问题。1.高位数字是什么意思(31,31,31 .... 3,2,2,2)2.他的垂直虚线是什么?为什么选择两行?3.为什么显示曲线图案?

library(glmnet)
data(MultinomialExample)
cvfit=cv.glmnet(x, y, family="multinomial", type.multinomial = "grouped")
plot(cvfit)

并且,下面是cvfit(result)的图

enter image description here

谢谢

r regression linear-regression glmnet
1个回答
3
投票

通过交叉验证,您正在尝试在这种情况下找到弹性网的lambda的最佳值。简而言之,弹性网是套索和岭回归的混合,其中岭回归试图将所有系数逼近零。 lambda(λ)基本上告诉您将其强制为零的程度。

  1. 数字是非零系数的数量

在x轴上,您具有不同的Lambda值,而glmnet尝试使用交叉验证。在最左侧,您的值接近于零,并且您希望所有系数都为非零,这就是顶部数字所代表的含义。您也可以在以下位置看到此内容:

cvfit$nzero
 s0  s1  s2  s3  s4  s5  s6  s7  s8  s9 s10 s11 s12 s13 s14 s15 s16 s17 s18 s19 
  0   1   1   1   1   1   1   2   3   3   7   7   8   8   9   9   9  10  10  10 
s20 s21 s22 s23 s24 s25 s26 s27 s28 s29 s30 s31 s32 s33 s34 s35 s36 s37 s38 s39 
 12  13  14  14  18  18  20  20  21  23  23  25  26  26  26  26  27  27  28  28 
s40 s41 s42 s43 s44 s45 s46 s47 s48 s49 s50 s51 s52 s53 s54 s55 s56 s57 s58 s59 
 29  29  30  30  30  30  30  30  30  30  30  30  30  30  30  30  30  30  30  30 
s60 s61 s62 s63 s64 s65 s66 s67 s68 s69 s70 s71 
 30  30  30  30  30  30  30  30  30  30  30  30 

来自小插图:

nzero:每个“ lambda”处的非零系数的数量。

  1. 这些线是具有最小偏差的λ值,与最小λ相距1 se]]
  2. y轴是偏差,它告诉您所有测试值发生多少误差。数值越低,模型的预测能力越好。您会期望最佳的Lambda值,从而使预测误差最小。这是从左数第一行。

cvfit$lambda.min
[1] 0.01291017

下一行是使用较少系数的lambda(因此更加简约),并且与最佳预测模型的距离仍然不太远。这是第二行:

cvfit$lambda.1se
[1] 0.02717467

您可以在Friedman et althis post中阅读更多内容>

© www.soinside.com 2019 - 2024. All rights reserved.