cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

要提取哪些特征来聚类文本?

我想为文本制作一个分类器,进一步用于建议给定文本最相似的文本。 该应用程序的流程如下: 使用...

回答 1 投票 0

聚类几何图形递归地超出聚类大小限制

我希望每个簇最多有 20 个项目。这是我在带有 PostGIS 扩展的 PostgreSQL 中的代码: WITH RECURSIVE clustered_data AS(--步骤 1:执行初始聚类 选择 pma。* ...

回答 0 投票 0

以低内存开销对许多文档进行主题建模

我一直在使用 BERTopic 0.16.3 进行主题建模项目,初步结果很有希望。然而,随着项目的进展和需求变得明显,我遇到了

回答 1 投票 0

如何对大多数同时出现在一个类中的标签进行聚类(在多标签分类问题中)

对大多数一起出现在数据框中的标签进行聚类(在多标签分类问题中)?例如我有这个数据框: 文字| 类型 =========================== 文字 1 | [...

回答 2 投票 0

使用 K-Means 在 LAB 颜色空间中按颜色对图像进行聚类

我尝试过以下代码。 他 = imread('hestain.png'); imshow(he), title('H&E 图像'); cform = makecform('srgb2lab'); lab_he = applycform(he,cform); ab = double(lab_he(:,:,2:3)); n行=...

回答 1 投票 0

使用 K-Means 在 LAB 颜色空间中按颜色对图像进行聚类

我尝试过以下代码。 他 = imread('hestain.png'); imshow(he), title('H&E 图像'); cform = makecform('srgb2lab'); lab_he = applycform(he,cform); ab = double(lab_he(:,:,2:3)); n行=...

回答 1 投票 0

如何从相异性(diana,簇R包)输出中获得最佳簇数?

我正在尝试从使用 cluster 包和 diana 方法(使用欧几里德相异性)获得的树状图中获取最佳簇数,如下所示: 我的数据 <- diana(mydata,...

回答 2 投票 0

pyTorch中有没有实现聚类评估方法?

我发现 PyTorch 中使用 GPU 的 k-means 实现比 CPU 快 30 倍。是否有任何方法(例如 Silhouette 分数、Dunn 指数等)最好在 PyTorch 中实现

回答 2 投票 0

pheatmap 聚类顺序

我有这个数据集: > 输出(mdata2) 结构(列表(EE = c(3.3221428469822,3.62699732299098,1.75430154205983, 0.809228977410138、1.24117055233438、2.93403148663873、4.01630566539058、 1.

回答 1 投票 0

transform 和 fit_transform 之间的区别

我一直在 Kaggle 上学习中级机器学习课程。在解释中,为了标记分类数据,他们使用了 sklearn.preprocessing 中的 LabelEncoder 库。 这里...

回答 3 投票 0

从“kml”R包中提取聚类标准的值

我正在使用 R 中的 kml 包来集群我的数据。我获得了显示估计聚类标准值的图。但我想获得的是标准的原始值......

回答 1 投票 0

如何根据 cluster_edge_ Betweenness 输出删除边

我想按照这里的要求做同样的事情,使用问题中的第一种方法。 遗憾的是,以下行中的 mods 变量未定义,我问自己如何调整: g2 <- delete.

回答 1 投票 0

SBERT 嵌入的聚类

我有一组句子,我已使用 SBERT 嵌入将其转换为向量。我想对这些向量进行聚类。 当我在网上寻找信息时,我不断看到帖子告诉我要做什么......

回答 1 投票 0

如何从 clusteval python 库获取 KMeans 的簇数

我正在使用 clusteval python 库来获取集群的数量,但这是一个过程,所以我无法存储数据。如何将簇值保存到变量中? [clusterval] > 适合使用

回答 1 投票 0

DP_GP_cluster生成的簇数量可以减少或者手动设置吗?

我一直在利用 DP_GP_cluster 包来识别两个数据集中多个时间点的基因表达数据趋势,每个数据集都有数千个基因。对于一个数据集,我生成了 28

回答 1 投票 0

我应该使用哪种模型来运行 h2o.ai 中的 K 均值聚类?

我正在使用 h2o.ai 和示例信用卡数据集来运行 kmeans 聚类。 我应该使用哪种模型来运行 h2o.ai 中的 K 均值聚类? 我选择了无监督学习。有 2 个带有 Km 的选项...

回答 1 投票 0

是否可以使用单个 IP 地址但具有下面给出的配置的不同端口进行集群?

第一个实例: 节点{ 名称 = "[email protected]" cookie = "emqxsecretcookie" 数据目录=“数据” } 簇 { 名称 = emqxcl discovery_strategy = 静态 ...

回答 1 投票 0

如何理解分层狄利克雷过程(HDP)中的“表”?

在Hierarchical Dirichlet Process中,作者用中式餐厅特许经营来解释HDP。据说每个餐厅都有很多桌子,不同的桌子可能共用一个...

回答 2 投票 0

如何使用 Python 对图像中掩模的各个部分进行聚类?

我需要以这样的方式拆分蒙版,如果蒙版内存在不一致,则会将其分离。例如,如果我在一只猫上画一个面具,我希望宽的部分(身体)成为一个面具并且......

回答 1 投票 0

使用R中的factoextra将最接近的点子集到簇的质心

我正在 R 中的factoextra 包中使用 kmeans() 函数。一切都运行良好 - 我有数据的集群,但我正在寻找一种方法来仅提取掉落的数据点...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.