要为序列分类问题选择哪个损失函数？

Question

我的问题如下：输入：[字符序列]

输出：[字符序列]

输入和输出均为BOW表示形式。

例如X = [12,3,4,5,6] ---> Y = [1,4,5,7,8]

我计划将Keras LSTM用于上述任务。

我的损失函数应该是什么？

Answer 1

最标准的方法是使用softmax对输出分布进行建模，适当的损失函数是分类交叉熵。

标准分类交叉熵期望目标是一热向量。如果要直接使用Y中的索引，请使用稀疏分类交叉熵。

（（参见this tutorial中的示例二，它似乎完全可以完成您想要的操作。）