我们如何在基于密度的算法中表示簇?换句话说,在基于原型的算法中,簇由质心和数据点的数量表示,在基于模型的算法中由质心和方差表示,在基于网格的算法中由长度、高度和每个网格中的数据点数量表示。那么,基于密度的算法(DBSCAN)怎么样,我们如何表示输出簇的摘要?
DBSCAN 的簇最好由核心点集来描述。
显然,不可能有“固定大小”的摘要,因为簇可以具有任意复杂的形状。
这不仅仅是 DBSCAN。 层次聚类怎么样? 这是eyception,你有一个紧凑的集群“摘要模型”;更常见的情况是集群只是一组点。