在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。
是否可以预先指定一个聚类结构,然后根据R中常见的聚类标准进行合并?
假设我有一个数据集,我在其中进行了聚类分析,例如 k=9。也许这是来自 k-means,或者我刚刚完成了完整的链接分层聚合,或者我注视着我......
我有一个数据框,其中有一个名为“address”的列和一个名为“vecor”的列,其中向量的长度为 700。我想按向量列对数据框进行聚类,但是当我尝试使用 KMeans 算法时...
如何在另一个表中显示每个簇中“kondisi”列有多少个值 1,2,3?
此图像是数据集的示例 所以我向 ChatGPT 和另一个 AI 助手询问了这个问题,但结果是 0。 这张图片是显示我想要的内容的表格 因此,从有关表格的图像中可以看出我的意思
我想知道什么是 from sklearn.cluster import KMeans 的良好替代品。网上其他人建议使用 Nvidia 的 RAPIDS 包中的 cuML,但这无法编译或者我...
python 中的 kmeans 聚类将数据垂直而不是水平分组
我有一个这样的数据集: 耦合系列 = [(9.752, 0.0005), (9.9792, 0.0008), (9.8571, 0.0036), (10.5017, 0.0038), (10.4808, 0.0038), (10.6975, 0.003), (12.1378, 0.0 008), (12.7328, 0.0005) , (14....
在我的程序中,我对 k-mean 算法采用 k=2,即我只需要 2 个簇。 我已经以非常简单直接的方式实现了,但我仍然无法理解为什么我的程序变得......
我有一个包含 x 和 y 变量的数据集。还有一个 z 列,指定 x 和 y 属于哪个组。有11组。我已经使用 K 均值聚类来创建一台机器,该机器将...
使用 k-means 和 200 个聚类对一组 100'000 个 L2 归一化 2048 维特征向量进行聚类需要多长时间?我的所有数据都在一个巨大的 numpy 数组中,也许有更合适的...
我必须通过使用 AIC 和 BIC 评分方法来确定 k 来确定 Mall_Customers.csv 中的组,有 2 个变量是支出分数 (1-100) 和年收入 (k$) 在此处输入图像描述 我想要一个
看到错误:“numpy.ndarray”对象没有属性“map”
我正在从较大的数据框中选择数据子集。 数据集 = df.select('RatingScore', '类别分数', '优惠券宾', 'TTM', '价格', ...
我可以仅基于一个变量(在 R 中)进行 K 均值聚类分析吗?
我有一个包含 2 列的数据框。第一列有气象站名称,另一列有相应的索引。我可以进行 K 均值聚类分析来对
让数组A中的值从高斯采样 分配。我想用 n_R 之一替换 A 中的每个值 R 中的“代表”,使得总量化误差为
我在 Alteryx 上的 k 均值聚类结果面临一些问题。我正在尝试对大约 5000 个文本描述的数据集进行主题建模。数据清理、解析、删除后...
我正在开发一个项目,需要使用 PySpark 对大规模数据集执行 K 均值聚类。该数据集由数百万行组成,并具有数千个特征列。我有
版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同集群结果
我正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在将 scikit-learn 从版本 0.22.2 更新到版本之后...
Kmeans:两个版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同聚类结果
我目前正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在从 0.22 版本更新 scikit-learn 后...
“锁定”行的图像 如何格式化我的数据框以匹配“wine”数据库与第一行的名称与其余数据分开? 我正在移动这些数据...
我正在尝试开发一种用于生物信息学的 K-Means 算法,到目前为止我设法开发了一个但它没有任何 k 参数,我将 k 值设置为 2。这段代码工作正常但现在我没...
我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想在...上执行 K-Means 聚类
ConsensusClusterPlus 函数和 pFeature 参数的子采样出错
以下函数返回一个我无法解决的错误。 请设置<- matrix(runif(50*30), nrow=50, ncol=30) ConsensusClusterPlus::ConsensusClusterPlus(pl.eset, pFeature = 0.50, reps ...