所以,我正在做一个项目,其细节如下: 假设我们必须训练一个神经网络,它得到一个 1000 x 3 矩阵作为输入和 1000 x 1 y 标签,它们是 r 的值。考虑以下等式:
r = o1 + o2*x1 + o3*x2 + o4*x1*x2 + o5*x1^2 + o6*x2^2
在训练矩阵中,第一列全是 1,第二列是 x1 的值,第三列是 x2 的值。 y 标签向量是 r,对应于 x1 和 x2 值。我们需要使用如下神经网络架构来预测值 r:
input layer ---> 3 neurons
hidden layer ---> 20 neurons ---> tanh
output layer ---> 6 neurons ---> linear
其中初始权重取自以零为中心的高斯分布,std dev 为 0.1.
所以,我已经想出或尝试了一些我愿意纠正的事情。
但它们效果不佳。我肯定错过了一些东西。
我确实有一些其他想法是我应该使用以下值:
x1, x2, x1*x2, x1^2, x2^2
作为我的训练数据。这也是多项式回归问题吗?关于如何处理这个问题的任何建议?我正在用 python 编码。