我可以仅基于一个变量（在 R 中）进行 K 均值聚类分析吗？

问题描述投票：0回答：1

我有一个包含 2 列的数据框。第一列有气象站名称，另一列有相应的索引。我可以进行 K 均值聚类分析，以便对具有相似索引值的站点进行分组吗？

我想采用这种方法，因为地图上车站之间的聚类可视化看起来相当不错。

我的数据框看起来像这样，

Station  Index 
A   6.3
B   6.8
C   7.2
D   5.6
E   6.1
.
.
.

我知道聚类是对多元数据进行分组的合适方法。我只是想知道这种方法是否也只适用于一个变量（例如索引）？

r cluster-computing k-means analysis

1个回答

3
投票

是的，可以，例如选择 3 个集群

cbind(df, cluster = kmeans(df$Index, 3)$cluster)
  Station Index cluster
1       A   6.3       3
2       B   6.8       1
3       C   7.2       1
4       D   5.6       2
5       E   6.1       3

数据

df <- structure(list(Station = c("A", "B", "C", "D", "E"), Index = c(6.3, 
6.8, 7.2, 5.6, 6.1)), class = "data.frame", row.names = c(NA, 
-5L))

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.