我想知道unigram,bigram和posgram之间的含义和区别。我搜索过互联网,但找不到全面的答案。任何帮助将非常感谢。
“这是一个例句”
Unigram:一次只考虑一个词 - >“This”或“is”或“an”......
Bigram(或n-gram):考虑n字组合(bi - > n = 2) - >“这是”,“是一个”,“一个例子”,“例句”
Posgram(不确定这个):考虑到词性上下文(例如“名词”“动词”......)来预测更多信息。更正式地说,它减少了所选内容的维度(减少从名词集中挑选一个单词而不是所有单词的更大集合)。