我有一个四个情感标签推文的数据集(愤怒,喜悦,恐惧,悲伤)。例如,我将推文转换为类似于愤怒的以下输入向量的向量:
愤怒代币的频率分布均值
word2vec
与愤怒相似情绪词典中愤怒的意思
标签词典中的愤怒意味着
该向量是否有效训练神经网络?
您的输入向量看起来很好。当然,您可能会稍后使用来自Twitter或其他相关API或数据集的统计和衍生数据来提高它。
您的网络有四个输出,就像您提到的那样:
Joy: [1,0,0,0]
Sadness: [0,1,0,0]
Fear: [0,0,1,0]
Anger: [0,0,0,1]
如果您愿意,您可以考虑添加多个隐藏层并使其成为一个深层网络,以提高神经网络原型的稳定性。
正如您的问题所示,在培训和测试您的数据之前,最好有一个良好的预处理器和特征提取系统,这当然是您知道的,项目的进展。
伟大的项目,最良好的祝愿,谢谢你的好问题,欢迎来到stackoverflow.com!