[大家好,我正在尝试计算句子“我想要中国菜”的概率,我成功了,但这仅是因为在该表下已将P(I |)记为自己的。我似乎无法理解0.25是如何计算的。有人可以将我推向正确的方向吗?谢谢!
通常,您会在句子的开头和结尾处使用一个虚拟字符,并使用该二元数来计算概率。我注意到他们正在使用<s>,如表格下方的公式所示。
<s>
在表本身中被省略,因此您不能从那里单独获得它。
句子的结尾标记有</s>,因此food是句子中最后一个单词的概率为0.68,尽管在典型的句子中将是句号。
</s>