利用传感器的时间序列预测故障的最佳模型。

问题描述 投票:0回答:1

我正在与一家公司合作,开发用于预测性维护的ML模型。我们的数据是一系列的日志文件。在每个日志文件中,我们有来自传感器的时间序列(温度、压力、MototSpeed......)和一个记录故障发生的变量。这里的目的是建立一个模型,使用日志文件作为输入(时间序列),并预测是否会出现故障。为此,我有一些问题:1)能够做到这一点的最佳模型是什么?2)处理不平衡数据的解决方案是什么?事实上,对于某种失败,我们没有足够的数据。我尝试将时间序列转化为固定长度的子时间序列后,使用LSTM构建一个RNN分类器。目标是如果有故障则为1,如果没有则为0。与0的数量相比,1的数量可以忽略不计。结果,模型总是预测为0,请问有什么解决办法?

python classification lstm recurrent-neural-network prediction
1个回答
0
投票

Mohamed,对于这个问题,你实际上可以从传统的ML模型开始(随机森林,lightGBM,或任何类似的性质)。我建议你专注于你的特征。比如你提到的压力,MototSpeed。看一些时间窗口的回溯。计算同一窗口中的移动平均数,最小最大值,st.dev。要解决这个问题,你需要有一套健康的功能。看看featuretools包。你可以使用它或者得到一些想法,使用时间序列数据可以创建什么特征。回到你的问题上。

1)能够做到这一点的最佳模型是什么?传统的ML方法,如上所述。你也可以使用深度学习模型,但我会先从简单的模型开始。另外如果你没有很多数据,我可能不会碰RNN模型。

2)处理不平衡数据的解决方案是什么?你可能想对数据进行过采样或欠采样。对于过采样,请看SMOTE包。

祝您好运

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.