我正在尝试确定最佳簇数。
# Determine optimal number of clusters
wss<-rep(0,2)
wss[1]<-sum(scale(price[,2:2],scale=FALSE)^2)
for(i in 2:16)
wss[i]<-sum(kmeans(price[,2:2],centers=i)$withinss)
plot(4:2,wss,type="b",xlab="Number of clusters",ylab="Within-cluster sum of squares")
除最后一行外,每一行都有效。最后一个给出错误:
xy.coords(x,y,xlabel,ylabel,log)出错:'x'和'y'长度不同
我从其他问题尝试了一些解决方案,但没有运气。有什么建议?谢谢你!
样本数据:
Country Price
Albania 1.57
Andorra 1.24
Azerbaijan 0.47
Austria 1.33
Belarus 0.73
Belgium 1.54
Bosnia & Herz. 1.29
Bulgaria 1.13
Croatia 1.44
Czech Rep. 1.32
Cyprus 1.28
Denmark 1.74
Estonia 1.41
Finland 1.61
France 1.67
Georgia 0.9
wss(y变量)的长度为16,但在x轴上,您使用的是4:2(长度为3)。这就是你得到错误的原因。
改变4:2到17:2使x和y变量的长度相同。喜欢:
plot(17:2,wss,type="b",xlab="Number of clusters",ylab="Within-cluster sum of squares")