我的问题如下:输入:[字符序列]
输出:[字符序列]
输入和输出均为BOW表示形式。
例如X = [12,3,4,5,6] ---> Y = [1,4,5,7,8]
我计划将Keras LSTM用于上述任务。
我的损失函数应该是什么?
最标准的方法是使用softmax对输出分布进行建模,适当的损失函数是分类交叉熵。
标准分类交叉熵期望目标是一热向量。如果要直接使用Y中的索引,请使用稀疏分类交叉熵。
Y
((参见this tutorial中的示例二,它似乎完全可以完成您想要的操作。)