我的问题如下。作为输入,我有整数序列,每个序列大约 200-500 个。序列中的每个数字都被标记为好或坏。每个序列中的第一个数字总是好的,但后续数字是否仍然被认为是好的取决于它之前的数字。有一个数学函数可以控制数字如何影响其后的数字,但该函数的具体细节尚不清楚。我们所知道的是,它开始接受每个数字,然后逐渐开始拒绝数字,直到最后每个数字都被认为是坏的。在这种情况发生之前,每个序列中只有大约 50 个号码会被接受。
一个数字的有效性可能不仅取决于它之前的数字,还取决于这些数字本身是否被认为是好还是坏。
例如:(好粗体数字)
4 17 8 47 52 18 13 88 92 55 8 66 76 85 36 ...
92 13 28 12 36 73 82 14 18 10 11 21 33 98 1 ...
试图通过猜测来确定系统背后的逻辑似乎是一项不可能完成的任务。所以我的问题是,可以训练神经网络来预测数字是好还是坏吗?如果是这样,大约需要多少序列来训练它? (假设 200-500 个数字的序列是 32 位整数)
由于您的数据是连续的并且数字之间存在依赖性,因此应该可以训练循环神经网络。循环权重负责处理数字之间的关系。
作为一般经验法则,不相关的输入序列越多,效果就越好。这篇调查文章可以帮助您开始使用 RNN:https://arxiv.org/abs/1801.01078