我无法从所附数据中解释我的 QQ 图。 Shapiro-Wilk 检验 p 值 = 0.14,我知道这意味着分布不会明显偏离正态分布。谁能确认根据该数据生成的QQ图是否支持这个结论,或者我应该更加谨慎?附上代码供任何人复制和粘贴。
注意:我在 R/RStudio 中制作了这个
PHD<- c(3.3,
3.3,
3.2,
3.3,
3.5,
3.1,
3.3,
2.8,
3.5,
2.5,
3.5,
3.2,
2.9,
3.2,
2.3,
3.3,
3.6,
3.1,
2.8,
3.8,
3.1,
3.1,
3.0,
3.4,
3.0,
3.0,
3.2,
3.6,
3.1,
3.9,
3.6,
3.4,
3.7,
3.7,
3.3,
3.7,
3.3,
3.1,
3.4,
2.8,
3.6,
3.4,
3.6,
3.2,
3.7,
3.4,
3.3,
4.1,
3.5,
3.6,
3.3,
3.4,
3.3,
3.3,
3.7,
3.1,
3.4,
3.8,
3.1,
3.9,
3.3,
3.6,
3.2,
4.0,
3.6,
3.3,
3.3,
3.5,
3.3,
3.8,
4.1,
3.7,
3.7,
4.0,
3.8,
4.0,
3.4,
4.1,
4.0,
3.6,
3.9,
3.5,
3.2,
2.7,
3.2,
3.3,
3.7,
2.9)
library(ggplot2)
data = data.frame(PHD)
ggplot(data = data, aes(sample = PHD))+
geom_qq()+
geom_qq_line(size = 1, color = "red")
当然,没有一个经验分布是完全正态的,但你的分布看起来很接近,因为你的数据点接近 qq 线。左侧的点略低一些,右侧的点略高一些,因此您的分布有点“重尾”……在极端情况下,点比预期的要多。由于您的数据四舍五入为 0.1,探索该问题的一种方法是生成正态分布的随机样本,对它们进行四舍五入,然后查看结果。对我来说,它看起来与你的经验数据相似。
test_data <- round(rnorm(500, mean=mean(PHD), sd = sd(PHD)),1)
df = data.frame(test_data)
ggplot(data = df, aes(sample=test_data))+
geom_qq()+
geom_qq_line(size = 1, color = "red")
另一方面,正式测试表明接近,但并不完全
shapiro.test(data$PHD)