我一直在按照我在here找到的教程尝试使用循环神经网络(RNN)进行情感分析。虽然我的模型可以正常运行,但我在准确性方面遇到了障碍,始终达到 85-90% 之间。我尝试了各种优化,但我不确定什么构成合理的基线来结束我的努力,特别是考虑到基于 Transformer 的 LSTM 模型的潜在效率。
我的主要疑问不是以进一步提高准确性为中心;相反,我寻求指导来确定何时考虑情感分析模型对于实际使用足够有效,特别是在使用 RNN 来完成此任务时。由于我对机器学习比较陌生,所以我不清楚何时确定我的目标已经实现。
嗯,这当然不是一个容易回答的问题。一般来说,在非常基本的层面上,您的模型应该优于随机基线。
以 85-90% 的准确度使用模型绝对没有问题,并且对于“大多数”应用程序应该没问题(我在这里宽松地使用术语“大多数”)。但同样,如果您正在进行这项研究,那么更高的性能是值得赞赏的(但这并不是决定研究结果重要性的唯一因素)。
除了上述一点之外,训练模型的使用(以及确定您是否实现目标的里程碑)与数据集和下游任务的严重性相关/高度主观。
话虽这么说,如果您还没有这样做的话,可能值得在您的数据集上微调预训练模型(如果您有的话)。