k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

严重不平衡/倾斜的数据集群

我在 Alteryx 上的 k 均值聚类结果面临一些问题。我正在尝试对大约 5000 个文本描述的数据集进行主题建模。数据清理、解析、删除后...

回答 1 投票 0

在大型基因数据集上实施 K 均值

我正在开发一个项目,需要使用 PySpark 对大规模数据集执行 K 均值聚类。该数据集由数百万行组成,并具有数千个特征列。我有

回答 1 投票 0

版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同集群结果

我正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在将 scikit-learn 从版本 0.22.2 更新到版本之后...

回答 0 投票 0

Kmeans:两个版本 0.22.2 和 1.2.2 之间具有相同 random_state 的不同聚类结果

我目前正在研究聚类问题。为了确保结果的重现性,我们最初将 KMeans() 中的 random_state 参数设置为 0。但是,在从 0.22 版本更新 scikit-learn 后...

回答 0 投票 0

如何设置我的数据,以便第一行在我的数据框中像这样被封锁?

“锁定”行的图像 如何格式化我的数据框以匹配“wine”数据库与第一行的名称与其余数据分开? 我正在移动这些数据...

回答 1 投票 0

Python K-Means 算法不能正常工作

我正在尝试开发一种用于生物信息学的 K-Means 算法,到目前为止我设法开发了一个但它没有任何 k 参数,我将 k 值设置为 2。这段代码工作正常但现在我没...

回答 0 投票 0

将距离矩阵传递给 sklearn 的 K 均值聚类

我目前正在使用 ASJP 数据库进行研究,我有一个 30 种语言之间相似性的距离矩阵,形状为 (30 x 30)。我想在...上执行 K-Means 聚类

回答 0 投票 0

ConsensusClusterPlus 函数和 pFeature 参数的子采样出错

以下函数返回一个我无法解决的错误。 请设置<- matrix(runif(50*30), nrow=50, ncol=30) ConsensusClusterPlus::ConsensusClusterPlus(pl.eset, pFeature = 0.50, reps ...

回答 1 投票 0

setting an array element with a sequence requested array has an inhomogeneous shape after 1 dimensions 检测到的形状是 (2,)+inhomogeneous part

导入操作系统 将 numpy 导入为 np 从 scipy.signal 导入 * 导入 csv 将 matplotlib.pyplot 导入为 plt 来自 scipy 导入信号 从 brainflow.board_shim 导入 BoardShim、BrainFlowInputParams、LogLev...

回答 6 投票 0

将所有字符串点打印成散点图

我试图在转换后将所有字符串点打印到散点图中,但没有打印我错过了什么, 从 sklearn.feature_extraction.text 导入 TfidfVectorizer 导入 matplotlib.p...

回答 0 投票 0

为什么 binary_opening() 会删除图像的像素,我该如何避免这种情况?

几周前我发布了以下问题:Get number of pixels in clusters with same color in an image 此解决方案与我在上一个问题中发布的图像一起使用。现在我有...

回答 0 投票 0

如何在非监督模型上使用“h”参数

当我在无监督模型中使用“h”和 0.1 时,出现以下错误:您的会话失败,因为所有可用 RAM 已被使用。 我想知道如何配置“h”,什么...

回答 0 投票 0

ValueError:无法将输入数组从形状 (8,) 广播到形状 (9,)

所以我在 bmi 和他的年龄的帮助下练习了关于糖尿病患者饮食建议的 ML,我总共使用了 2 个数据集,它们是 input.csv 和 inputfin.csv,然后在分离之后......

回答 0 投票 0

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20)

ValueError:传递值的形状是 (1000, 1),索引表示 (1000, 20) 这是我在 python 中的代码 编码 = OneHotEncoder() encoded_cols = encode.fit_transform(data[['Sex', 'Housing', 'Saving acco...

回答 1 投票 0

合并或删除边缘地图边界上的重复线

我正在尝试在图像的所有边缘上精确地绘制一条线。我能够画出线条,但有些线条是重复的,我坚持了好几天,任何帮助将不胜感激。我试过了

回答 0 投票 0

AzureML - 如何从集群模型创建 Web 服务

我创建了一个推理管道,它使用 K-means 对一组数据进行聚类。从设计器运行时,它工作正常并返回输入数据的集群分配。一旦部署为网络服务...

回答 1 投票 0

识别集群在文本数据中代表什么

我有一个包含 2 列的 pandas 数据框:job_title,其中包含 IT 领域的职位,第二列 job_activities 是对该工作中执行的活动的描述...

回答 0 投票 0

时间序列聚类分析时空python

我想根据三个气象场对模式进行聚类。每个字段的形状为 31、137、181(31 个时间步长、137 个纬度、181 个经度),我想要每个

回答 0 投票 0

Scikit-Learn 'list' 对象的 AttributeError 没有属性 'shape' 即使我已经验证输入是一个 numpy 数组

运行此功能时 def evaluate_performance(自我,数据): 数据 = np.array(数据) 打印(数据。形状[0]) 如果 self.cluster_method == 'kmeans': 预测标签...

回答 1 投票 0

在 R studio 中使用 30 多个微生物组样本进行 K-means 聚类

我有 33 个包含微生物群落数据的样本。 我使用 full_join 命令将所有 33 个样本合并到一个数据帧中。数据框如下所示: Samp1 Samp2 Samp3 Sa...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.