聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。
我第一次在我的项目中使用k-means。我的数据集有超过 400,000 行和 11 列,我对 k= 3、5、7、9 和 10 运行 k 均值。花了超过 65 分钟,但仍然没有结果...
使用K-Means进行文档聚类,聚类应该基于余弦相似度还是基于术语向量?
抱歉,如果答案很明显,请友善,这是我第一次来这里:-) 如果有人可以指导我适当的输入数据结构,我将不胜感激......
这些是我拥有的一堆数据帧的 2 个示例: 天 p1 p2 p3 4 2.1 3.4 4.5 15 2.2 3.6 2.8 39 2.5 2.1 0.4 还有这个: 天 p1 p2 p3 4 2.1 3.4 4.5 18 8.2 2.2 5.8 22 6.4 3.6 1.4 29 2.4 ...
我正在尝试对 1428 个点的 3D 坐标 DataFrame 中的点进行聚类。 集群是相对平坦的平面,是细长的云数据帧。它们是非常明显的簇,所以我希望......
我使用了 DBSCAN 的 ELKI 实现来从火灾数据集中识别火灾热点簇,结果看起来相当不错。数据集是空间的,聚类是基于纬度的,
我正在寻找与此类似的图像(正方形)布局的现有算法: 有人知道类似的事情吗?也许是一个库或只是一个描述? 它会是这样的: 普...
我有一个(对称)矩阵 M 表示每对节点之间的距离。例如, A B C D E F G H I J K L 0 20 20 20 40 60 60 60 100 120 120 ...
我正在尝试使用R树实现DBSCAN。我们可以以R树的形式存储数据。所以我的问题是如何在R树中存储实时数据以及我应该如何实现区域查询来查找
需要帮助找到一个开放/免费的基于密度的聚类库,该库将距离矩阵作为输入并返回聚类,其中每个元素距...的最大“x”距离
我们如何在基于密度的算法中表示簇?换句话说,在基于原型的算法中,簇由质心和数据点的数量表示,在基于模型的算法中由
调整兰特指数 (ARI) 是比较两个集群的常用指标。不幸的是,在执行聚类分析并比较它们后,我通常会得到负 ARI。我该如何解释这些
我正在使用 DBSCAN 等聚类算法。 它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定从它到新点的距离...
在 CPLEX OPL Studio 中创建具有加性标准的数学聚类模型时出现的问题
我正在尝试在 CPLEX OPL Studio 中创建一个模型,用于使用附加标准进行聚类,但我有许多错误,我不知道如何正确修复,因为我对 OPL Studio 非常不好
我对网络分析还很陌生。 我有一个有很多互连的网格。网格由不同长度的边组成。我想将这个网格聚类成长度相似的段。 ...
如何将 vegdist() 函数输出的相异矩阵用于 hclust()?
我使用 vegdist() 函数计算了相异矩阵,方法指定为“morisita”。然而,即使 hclust() 函数是为了读取距离或相异度而构建的
我正在自学使用 Phenograph 进行聚类分析,并生成热图来显示细胞表型以及群体百分比,作为使用复杂 heatma 的注释......
如何使用 hclust 和 cutreeDynamic 创建按簇着色的树状图
我正在研究聚类问题,我想使用 hclust 函数创建树状图,并使用 cutreeDynamic 从上述树状图创建聚类。其实我已经
我有 9000 个美国积分(即账户),具有各种不同的字符串和数字列/属性。我正在尝试将这些积分/帐户均匀地划分为公平的分组......
部署在外部Tomcat10上的Spring Boot 3会话集群错误
我使用 Spring Boot 3.x 和外部 Tomcat 10。 在外部 Tomcat 上设置会话集群 如果我检查jsp页面,会话是共享的,但是 如果我用 spring boot se 检查相同的逻辑...
我有纵向数据如下: 将 pandas 导入为 pd # 仅使用“sample_A”或“sample_B”中的样本定义更新数据 数据 = { 'gene_id': ['gene_1', 'gene_1', 'gene_1', 'gene_1', 'g...