多元时间序列数据的准备

问题描述 投票:0回答:1

我正在做一个关于指数/股票价格预测的大学项目。我计划使用组合的 cnn-lstm 模型,并且我有几种不同类型的数据:开盘高低收盘量、价值、基本数据(例如失业率和各种利率)、技术指标(例如 RSI、MACD 等)以及移动平均线(例如SMA、EMA、WMA 等。为网络准备数据的最佳方式是什么?

此时我正在使用以下转换 对于 OHLC - 简单微分 对于基本数据 - 对数化 对于移动平均线 - 从该移动平均线的值中减去蜡烛开盘值 指标值不变 然后我对所有数据集使用 StandardizeNormalizer。我也尝试过分别对每个序列进行归一化(稳健缩放、标准化、最小最大缩放),并对所有数据进行区分,但效果并不好

machine-learning keras deep-learning time-series forecasting
1个回答
0
投票

您必须使用前向填充或插补来填补数据中缺失的空白,然后使用前向填充使它们具有相同的分辨率,例如将季度数据变为每小时数据。然后,您需要使用差分来缩放所有平稳数据,并且可以使用 A.D. 富勒检验来判断数据集是否平稳。然后使用 z 分数缩放进行标准化。然后你终于准备好训练了。您还需要考虑您想要对数据进行的任何特征工程。

© www.soinside.com 2019 - 2024. All rights reserved.