给定具有股票A的d个特征的n个样本,我们可以建立(d + 1)维线性模型来预测利润。但是,在一些书中,我发现如果我们有m个不同的股票,每个股票具有n个样本和d个特征,那么他们将这些数据合并以获得m * n个具有d个特征的样本,以建立一个(d + 1)维线性模型预测利润。
我的困惑是,不同的股票通常彼此之间没有什么联系,它们的利润受不同的因素和环境的影响,所以为什么可以将它们合并以建立一个模型?
[如果您使用R作为选择工具,则可能会喜欢time series embedding howto和its appendix-其背后的数学是Taken's theorem:
[[Takens定理给出]条件,在该条件下可以从对动力学系统状态的观察序列中重建混沌动力学系统。
在我看来,您所引用的陈述似乎恰恰与此定理有关:对于d
功能(我们很幸运,如果我们知道该数字-我们通常不知道),我们需要d+1
尺寸。如果应该预测更多的时间序列,则如果特征相同,我们可以使用相同的嵌入空间。