cluster-analysis 相关问题

聚类分析是将“相似”对象分组为称为“聚类”的组的过程,以及对这些结果的分析。

我需要对两个甜甜圈形状数据集进行谱聚类。(Matlab)

我已经尝试了几个小时,但找不到解决方案。 我有“两个甜甜圈”数据样本(变量“X”) 您可以在下面的链接下载文件 甜甜圈数据集(rings.mat) 扩展到 2D 形状,如下图所示

回答 1 投票 0

稀疏数据集上的谱聚类

我正在一个数据集上应用谱聚类(sklearn.cluster.SpectralClustering),该数据集具有相当多的相对稀疏的特征。在 Python 中进行谱聚类时,我得到以下结果

回答 1 投票 0

使用 sklearn 和大亲和力矩阵进行谱聚类

我正在尝试使用 scikit-learn 提供的谱聚类方法来聚合我的数据集的行(只有 16000 行)。 在我预先计算亲和力矩阵(a

回答 1 投票 0

随着聚类数量的增加,轮廓值也随之增加

我有一个矩阵,行是品牌,列是每个品牌的特征。 首先,我使用 scikit learn 计算亲和力矩阵,然后在

回答 1 投票 0

在混合分类和数值数据的 k 原型聚类算法中运行轮廓分数计算速度很慢

我正在使用 k-prototyps 库来实现混合数字和数值数据类型。根据 https://github.com/nicodv/kmodes/issues/46 为了计算 k 个原型中的轮廓分数,我计算了

回答 2 投票 0

sklearn中可以使用余弦距离进行Kmeans聚类吗?

我想使用 Sentence Transoformer 中的 BERT 嵌入对我的文档进行聚类,尤其是 bert-base-nli-mean 标记,并且我想使用 kmeans 聚类对该嵌入进行聚类,但我有一个问题...

回答 1 投票 0

类型错误:pyclustering 库中未调整大小的对象的 len()

我正在使用 pyclustering 库来执行 K 均值。我正在使用的数据集以 CSV 格式读取,如下面的代码所示。我尝试过将 X_scaled 作为 numpy 数组传递,作为我们的列表......

回答 1 投票 0

如何使用 rgeoda 将 R 中的纬度/经度点聚类为恰好 5 个最近邻的组?

我正在努力根据学校之间的距离将学校聚集在一起。出于政策(预算)原因,我们希望这些组中尽可能多地包含 5 所学校。我们有...

回答 1 投票 0

cdlib和igraph的variation_of_information结果不同

假设我们有两个社区分区,如下所示: 社区分区1 社区0= [8, 16, 17, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33] 社区 1= [1, 2, 3, 7, 11, 12, 13, 15, 18]

回答 1 投票 0

3维点集的聚类(python)

我从显示球轨迹的电影中提取了一组点。 每个点都有与从电影中提取的图像中球的位置相对应的坐标 (x,y),以及 z 坐标...

回答 1 投票 0

K表示当肘部图是平滑曲线时找到肘部

我正在尝试使用以下代码绘制 k 的肘部: 加载 CSDmat %mydata 对于 k = 2:20 opts = statset('MaxIter', 500, '显示', '关闭'); [IDX1,C1,sumd1,D1] = kmeans(CSDmat,k,'

回答 2 投票 0

对具有 DNA 序列的 fasta 文件进行聚类,以找到最不匹配的克隆

我正在尝试创建一个集群来分析 DNA 序列并找到其中不太匹配的模式(例如 <25% match). Is it possible to perform cluster analysis (k-means or any other approa...

回答 1 投票 0

将距离矩阵传递给sklearn中的k均值聚类

根据 sklearn kmeans 文档,它说 k-means 需要一个 shape=(n_samples, n_features) 的矩阵。但我提供了一个 shape=(n_samples,n_samples) 的距离矩阵,其中每个索引......

回答 2 投票 0

如何用 R 中的 x 和 y 对二维轨迹进行聚类

我在 x 轴和 y 轴上有数千条二维轨迹。示例数据集如下所示。每条轨迹都以x轴和y轴的形式表示,所有轨迹都有

回答 1 投票 0

如何使用 Weka 聚类 XMeans 将聚类分配保存在输出文件中?

上下文 我想使用Weka聚类算法XMeans。但是我不知道如何从 Weka 的 GUI 获取集群分配。 目前我只能看到集群 ID 列表以及

回答 2 投票 0

子样本之间的系数检验比较

我正在尝试对两个子样本的系数检验进行比较。为了实现这一目标,我执行以下操作: 完整模型 <- lm(y ~ v1*subsample_dummy + fixed_effects, data=df) reduced_mod...

回答 1 投票 0

有人使用过 Snowflake 搜索优化并获得了优于集群键的好处吗?

参考: https://docs.snowflake.com/en/user-guide/search-optimization-service.html#what-access-control-privileges-are-needed-for-the-search-optimization-service 有人用过雪花搜索吗

回答 2 投票 0

交互和聚类的回归系数

我正在运行一个具有交互项和双聚类的线性回归模型,并且很难获得组合回归系数和 95% 置信区间......

回答 1 投票 0

如何将seaborn.clustermap与大型(20 000个条目)数据集一起使用?

我经常使用 sns.clustermap,我非常喜欢它作为一个简单的工具来概述大量数据(在我的例子中是时间序列数据,大多数是几百个条目)。 所以我想...

回答 1 投票 0

R NMF包:如何提取样本分类?

在 NMF R 包中,可以使用consensusmap() 来可视化输出。这些图显示了哪些样本属于“共识”轨道中的哪些集群。 我想提取这个样本分类...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.