在Word2vec中,我们可以使用单词而不是句子进行模型训练
如下代码gberg_sents是句子标记模型= Word2Vec(句子= gberg_sents,大小= 64,sg = 1,窗口= 10,min_count = 5,种子= 42,工人= 8)
像这样我们也可以使用单词标记
不,word2vec是用语言建模目标训练的,即,它预测在其他单词的周围出现什么单词。为此,您的训练数据需要是实际的句子,以显示单词在上下文中的使用方式。它实际上是单词的上下文,它为您提供嵌入中捕获的信息。