我正在分析一组数据,由 5 个自变量(x1,x2,x3,x4,x5)和一个因变量(y)组成,每个变量有 60 个数据。 当我尝试运行下面的代码来识别离群值和影响点,但没有显示图表,并且 dev 和 c 计算不正确时。我如何修复下面的代码以显示影响诊断,如所附的屏幕截图。谢谢。
data data;
INFILE "/home/" dlm=",";
input x1-x5 y;
run;
PROC STANDARD DATA=data MEAN=0 OUT=zdata;
VAR x1-x5;
RUN;
PROC REG DATA=zdata PLOTS;
model y=x1-x5/DWPROB;
RUN;
PROC LOGISTIC DATA=data PLOTS;
MODEL y=x1-x5/ link=glogit INFLUENCE;
OUTPUT OUT=i1 C=c Cbar=c_1 P=p RESCHI=chi RESDEV=dev
DIFCHISQ=chi_s DIFDEV=dev_s H=h C=cookd DFBETAS=ALL;
RUN;
PROC PRINT DATA=i1;
where dev<-2;
var x1-x5 dev;
run;
proc print data=i1;
where c>0.4;
var x1-x5 C;
run;