如何使用神经网络预测多项式的系数?

问题描述 投票:0回答:0

所以,我正在做一个项目,其细节如下: 假设我们必须训练一个神经网络,它得到一个 1000 x 3 矩阵作为输入和 1000 x 1 y 标签,它们是 r 的值。考虑以下等式:

r = o1 + o2*x1 + o3*x2 + o4*x1*x2 + o5*x1^2 + o6*x2^2

在训练矩阵中,第一列全是 1,第二列是 x1 的值,第三列是 x2 的值。 y 标签向量是 r,对应于 x1 和 x2 值。我们需要使用如下神经网络架构来预测值 r:

input layer ---> 3 neurons
hidden layer ---> 20 neurons ---> tanh
output layer ---> 6 neurons ---> linear

其中初始权重取自以零为中心的高斯分布,std dev 为 0.1.

所以,我已经想出或尝试了一些我愿意纠正的事情。

  1. o1,...,o2 是反向传播后的最终权重。
  2. 添加最后一层 1 个神经元来预测 r 的值。
  3. 使用输入到最后一个神经元的最终权重作为我的最终结果。

但它们效果不佳。我肯定错过了一些东西。

我确实有一些其他想法是我应该使用以下值:

x1, x2, x1*x2, x1^2, x2^2

作为我的训练数据。这也是多项式回归问题吗?关于如何处理这个问题的任何建议?我正在用 python 编码。

python numpy tensorflow deep-learning neural-network
© www.soinside.com 2019 - 2024. All rights reserved.