我正在尝试使用 lstm 对评论进行二进制分类(评论已经经过预处理和分割)。我创建了一个模型,但它没有学到任何东西。
在某些情况下,无论我选择多少个纪元,我都会获得完全相同的准确性。
GitHub链接:https://github.com/PavloChaika/ML_SET/blob/homework3/HW3/HA3%20-%20IMDB%20competition.ipynb
我尝试了 num_layers、hidden_size、learning_rate 的不同组合。我使用 input_size 因为 ithervise 它工作得非常慢(即使我意识到我只有 1 个输入,我只是尝试至少训练一点,并且因为我对评论进行了分类,我的猜测是它应该工作)我尝试使用 1输入,但结果非常相似
我找到原因了。我只是没有添加预处理来使用我的单词嵌入而不是标记化单词