当我使用word2vec.word2vec(train =“corpus.txt”)时,它如何解析文件中的单词?
有人可以给我一个例子或相关资源吗?提前致谢。
有更多不同的资源如何做到这一点。使用word2vec技术与gensim的possible way之一是here或git。
使用word2vec的主要思想是处理像vector这样的单词的机会。从计算过程来看非常舒服。
假设你的文字有很多单词。如果你只使用这些单词创建字典,你以后就会产生误解,因为它们在多维空间中的含义是错误的。如果您将使用基于Google等给定word2vec模型的向量,您将更好地将单词分布到已定义的空间中。
拥有模型,您可以轻松计算相似度等,从文本中提取意义。它已经是一个合乎逻辑的部分,并将与您的意图相关。