我正致力于数据挖掘项目,以从智能仪表数据中挖掘人类活动模式。我无法找到KMeans的解决方案或如何使用KMeans算法进行群集。
数据是这样的,一天分为48个插槽,每个插槽30分钟,有效设备在那个插槽。
现在我想创建像时间(早晨,下午,晚上,夜晚),工作日,周和/或一年中的季节,季节的群集。我应该采用什么方法来使用KMeans获得结果?
KMeans不能以明显的方式以有意义的方式用于此。
该算法设计用于连续变量,其中它计算平均值(因此名称),并且平均偏差与平均值最小化。但是您的数据并不是持续有价值的。使用平均设备ID和平方偏差没有意义。