GloVe 最近邻居(NLP)

问题描述 投票:0回答:1

我正在尝试根据 nlp.stanford.edu/projects/glove 和 gensim 库获取“青蛙”的最近邻居(NLP),但我无法获得他们(斯坦福大学的网络)结果¡。 为什么和他们的不一样??任何人都可以建议/解释我吗?

这是我的Python代码:

import gensim ## nlp.stanford.edu/projects/glove >> glove.6B.zip >> glove.6B.XXd.txt new_model = gensim.models.keyedvectors.load_word2vec_format('./glove.6B/glove.6B.300d.txt',binary=False,no_header=True) print(new_model) print(new_model.most_similar('frog'))
这些是我对 300d、200d、100d 和 50d 词向量的结果,但是任何人都与 

stanford website 中的结果相同。有谁知道原因吗??

nearest neighbors

非常感谢。

stanford-nlp
1个回答
0
投票
也许是因为你正在使用

glove.6B

,但他们正在使用
glove42B
glove840B
。不过,我在他们的论文/github/网站上找不到详细信息,所以你应该测试一下以确定。
请注意,42B 和 840B 向量仅存在于 300d 中。

© www.soinside.com 2019 - 2024. All rights reserved.