gensim.models.Word2Vec
类有方法predict_output_word()
。现在我使用prelearned模型,但它保存在类gensim.models.KeyedVectors
中。有类模拟方法吗?或者我如何从gensim.models.KeyedVectors`获取gensim.models.Word2Vec
的实例?
我知道most_similar()
,但它是另一回事。
KeyedVectors
实例只是单词和向量本身,而不是完整模型,包括对训练很重要的内部权重(以及训练期间的内部预测)。
因此,KeyedVectors
对象缺乏进行预测所需的状态,因此也缺乏该方法。 (另请注意,该方法运行起来相对昂贵,仅适用于负抽样模型,并且没有给出与训练期间内部进行的“稀疏”半预测非常相同的加权结果.Word2Vec的观点不是'确实是准确的邻居预测,但是使用这种预测尝试来引导具有其他有用属性的向量排列。
如果您自己训练单词,则应在以后需要完整模型功能时保存完整模型。