我发现了GoogleNews-vectors-negative300.bin库,但仅适用于ENG单词,在word2vec中是否有针对类似单词的波兰语实现?
我已经尝试使用cc.pl.300.bin和NKJP-PodkorpusMilionowy库...
public Word2Vec getWord2Vec() {
File gModel = new File("C:/Users/user/Desktop/GoogleNews-vectors-negative300.bin.gz");
return WordVectorSerializer.readWord2VecModel(gModel);
}
文件...
https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.pl.vec
...链接自...
https://fasttext.cc/docs/en/pretrained-vectors.html
...如果您的图书馆加载了用于交换单词向量的简单“文本”格式,则可能对您有用。 (与cc.pl.300.bin
文件不同,它不是Facebook FastText特定的二进制格式。)