聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我正在尝试寻找潜在的集群或节点组(在本例中为论坛消息)。 在当前数据中,每个节点(消息)已经与其他 n 个消息暂时分组在一起,并且......
图论和数据挖掘是我对计算机科学还很陌生的两个领域,所以请原谅我的基本理解。 我被要求绘制层次聚类图的树状图。 ...
从 R 中的切割树状图中提取标签成员资格/分类(即:树状图的 cutree 函数)
我正在尝试从我在一定高度切割的 R 树形图中提取分类。在 hclustobject 上使用 cutree 很容易做到这一点,但我不知道如何在树状图上做到这一点
我有以下包含 10 个变量的数据集: 我想用这个多维数据集识别聚类,所以我尝试使用以下代码使用 k-means 聚类算法: clustering_kmeans = ...
如何使用WeightedCluster聚合序列并应用于多通道序列分析
我有54399个案例,2个通道(HOM和HOS),我想使用多通道序列分析,数据示例如下: ID 霍姆1 霍姆2 霍姆3 霍姆4 居屋1 居屋2 居屋3 居屋4 1 一个 一个 乙 C 不 是的 不 ...
我有多个数据集,所有数据集的组织方式相似(相同的变量、值等)。我已经使用 KModes 独立分析了数据集,但是,我试图寻找可能发生的趋势......
当我运行 k-means 代码时出现此错误 -> AttributeError: 'NoneType' 对象没有属性 'split'
从 sklearn.cluster 导入 KMeans CS = [] 对于范围 (1, 11) 内的 i: kmeans = KMeans(n_clusters = i, init = 'k-means++', max_iter = 300, n_init = 10, random_state = 0) kmeans.fit(X) cs.
我有一个有向图,其中节点和边都有重要性或权重属性。我正在寻找 python 中的社区或模块检测实现,它将同时考虑两者
我正在学习如何使用 crimCV 来聚类我的数据。我的输入是整数,我将 crimCV 的 NA 替换为 -1,将其视为 NA。但每次我运行这段代码时: 型号 <- crimCV(test...
我第一次在我的项目中使用k-means。我的数据集有超过 400,000 行和 11 列,我对 k= 3、5、7、9 和 10 运行 k 均值。花了超过 65 分钟,但仍然没有结果...
使用K-Means进行文档聚类,聚类应该基于余弦相似度还是基于术语向量?
抱歉,如果答案很明显,请友善,这是我第一次来这里:-) 如果有人可以指导我适当的输入数据结构,我将不胜感激......
这些是我拥有的一堆数据帧的 2 个示例: 天 p1 p2 p3 4 2.1 3.4 4.5 15 2.2 3.6 2.8 39 2.5 2.1 0.4 还有这个: 天 p1 p2 p3 4 2.1 3.4 4.5 18 8.2 2.2 5.8 22 6.4 3.6 1.4 29 2.4 ...
我正在尝试对 1428 个点的 3D 坐标 DataFrame 中的点进行聚类。 集群是相对平坦的平面,是细长的云数据帧。它们是非常明显的簇,所以我希望......
我使用了 DBSCAN 的 ELKI 实现来从火灾数据集中识别火灾热点簇,结果看起来相当不错。数据集是空间的,聚类是基于纬度的,
我正在寻找与此类似的图像(正方形)布局的现有算法: 有人知道类似的事情吗?也许是一个库或只是一个描述? 它会是这样的: 普...
我有一个(对称)矩阵 M 表示每对节点之间的距离。例如, A B C D E F G H I J K L 0 20 20 20 40 60 60 60 100 120 120 ...
我正在尝试使用R树实现DBSCAN。我们可以以R树的形式存储数据。所以我的问题是如何在R树中存储实时数据以及我应该如何实现区域查询来查找
需要帮助找到一个开放/免费的基于密度的聚类库,该库将距离矩阵作为输入并返回聚类,其中每个元素距...的最大“x”距离
我们如何在基于密度的算法中表示簇?换句话说,在基于原型的算法中,簇由质心和数据点的数量表示,在基于模型的算法中由
调整兰特指数 (ARI) 是比较两个集群的常用指标。不幸的是,在执行聚类分析并比较它们后,我通常会得到负 ARI。我该如何解释这些