k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

多个KPI字段的K-均值

我是机器学习的新手。我的问题可以是非常基本的。我得到了一个k-mean训练模型,这个模型是基于6个KPI字段。我有一个6个KPI的数据集,我成功地使用了预测方法和...

回答 1 投票 -1

k-means聚类图谱

我正在使用sklearn的K-Means聚类,并希望使用训练好的K-Means模型将标签替换为中心值。我使用的代码如下。# 初始化K -Means聚类模型-...

回答 1 投票 0


K均值聚类:更新每个聚类的中心点并选择颜色的功能。

这是我正在经历的一个关于K Means Clustering的例子的节选。谁能帮我理解一下最后两行是怎么回事,好吗?具体来说。什么是class_of_points...

回答 1 投票 0

在地图上的聚类位置,每个聚类有相同数量的点。

我在地图上有一些特定的点,我需要把它们归为大小相同的不同簇,最后一个簇可以计数%n。我读了这些答案1,2和3,但它没有帮助。I ...

回答 1 投票 0

我正在处理一个DTM,我想做k-means、heirarchical和k-medoids聚类。我是不是应该先对DTM进行标准化?

数据,AllBooks有590个观测值8266个变量。下面是我的代码。AllBooks = read_csv("AllBooks_baseline_DTM_Unlabelled.csv") dtms = as.矩阵(AllBooks) dtms_freq = as.矩阵(...)

回答 1 投票 0

带加权变量的K-均值法

我想进行K-means分析,其中一些变量应该被认为比其他变量更重要。我已经找到了kmeansw函数,但在阅读了它的帮助后,我有点困惑:...

回答 1 投票 1

绘制K-Means聚类后的聚类图。

我在一个数据集上使用了K-Means聚类,我发现了7个聚类,但我无法绘制聚类。请看下面我使用的代码:- # 绘制聚类数据 fig, ax = plt......

回答 1 投票 0

文件的聚类与它的结构。

我的工作是通过观察文档的结构来进行聚类。到目前为止,我所做的。在下面的代码中提取了嵌入(Bert embeddings)中的结构变量X。我所...

回答 2 投票 2

基于Python中的空间聚类方法填补缺失值

给定一个数据框如下: 纬度 经度 用户服务 0 -27.496404 153.014353 02:杜希格塔 1 -27.497107 153.014836 NaN 2 -27.497118 153.014890......

回答 1 投票 0

k-means中心点标签在同一程序的不同运行中会发生变化?

我观察到,尽管原始特征是相同的,但同一程序的后续运行为k-means聚类提供了不同的标签。该程序将一组变换应用于 ...

回答 1 投票 0


处理K中的ID号意味着聚类

我是机器学习的新手。我想知道当有大量的分类数据时,如何处理它们。例如,我有一个客户ID的特征(例如-255458565),有一个近 ...

回答 1 投票 0

使用不同的颜色和标签进行聚类

我正在研究文本聚类。我需要用不同的颜色来绘制数据,我使用了kmeans方法进行聚类,tf-idf进行相似度分析。Kmeans_labels =KMeans(n_clusters=3).fit(...)。

回答 1 投票 0

使用TF-IDF在K-Means中绘制中心点。

我正在用KMeans编码来组文本,一切都很好,但我无法将中心点绘制在一起。我不知道如何使用matplotlib,只知道seaborn连同创建的向量 ...

回答 1 投票 0

为什么NMI值较小,而聚类中的聚类精度和兰德指数较高?

我使用https:/www.mathworks.commatlabcentralfileexchange32197-clustering-results-measurement 在MATLAB中评估我的聚类精度,它提供了精度和rand_index,...

回答 1 投票 0

从K-Means(Voronoi单元)中获得决策的边界。

我有一个K-means的实现,它返回聚类。所说的聚类是要将一个城市进行苔化。我感兴趣的是得到每个簇的边界,即voronoi单元。我的代码是...

回答 1 投票 0

在PyPI的pyclustering库中的kmedoids的n-iter?

对于PyPI中的pyclustering库中实现的kmedoids,我如何才能访问直到收敛为止的迭代次数的属性?在Scikit Learn实现的......

回答 1 投票 0

如何在sklearn新版kmeans中使用预计算的距离矩阵?

我正在计算我自己的距离矩阵,如下所示,我想用它来进行聚类。 import numpy as np from math import pi #points containing time value in minutes points = [100, 200, 600, 659, ...

回答 1 投票 0

多变量正态分布的聚类分析

我有 N 个多变量正态分布。我想对它们进行聚类,以便去除多余的分布(那些彼此足够接近的分布),或者通过增加它们的sigmas来合并它们。是...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.