我正在训练普通的 5 层 LSTM。我的任务是尝试比较没有和有附加功能的两个模型(基准模型和比较模型)。然而,我发现对比模型只是在某种微调方式上超越了基线。
例如,我将学习率设置为0.01,比较模型获胜,但是当我将学习率设置为0.005时,基线获胜。调整其他超参数也会导致比较差异。
出现这种情况正常吗?我该怎么解释呢?