如何比较不同年份的集群?

问题描述 投票:0回答:1

我有多个数据集,所有数据集的组织方式相似(相同的变量、值等)。我使用 KModes 独立分析了数据集,但是,我试图寻找多年来可能出现的趋势。我将如何比较不同年份的集群?

machine-learning data-science cluster-analysis cluster-computing
1个回答
0
投票

要使用 K 模式比较不同年份的聚类,您可以:

  1. 比较质心:计算每年聚类质心之间的相似度(例如,杰卡德距离或汉明距离)。
  2. 跟踪集群变化:比较一段时间内的集群大小和特征分布以识别趋势。
  3. 使用可视化:应用降维(例如,PCA)来可视化集群如何跨年重叠。
  4. 集群一致性:使用调整兰德指数 (ARI) 等指标来衡量集群之间多年来的稳定性。
  5. 集群重叠:创建热图以可视化多年来集群之间的重叠。
© www.soinside.com 2019 - 2024. All rights reserved.