word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

如何计算2个node2vec模型之间的距离

我有2个不同时间戳的node2vec模型。我想计算两个模型之间的距离。两个模型具有相同的词汇，我们将更新模型。我的模型就像这个模型1：“ 1”：0.1，...

python graph nlp word2vec

回答 1 投票 0

将新操作添加到google colab上的tensorflow

我正在尝试在Google colab上编译一些.cc文件（如此处和此处所示），但是我找不到包含op.h的文件，而在编译时出现以下错误：word2vec_o ps.cc:16:10：致命错误：...

tensorflow word2vec google-colaboratory embedding

回答 1 投票 0

Word2Vec词汇相似之处

我在大约750k个单词的文本上运行了word2vec算法（在删除一些停用词之前）。使用我的模型，我开始查看与选择的特定单词最相似的单词，以及相似性...

python machine-learning neural-network nlp word2vec

回答 2 投票 0

MemoryError：在python中使用word2vec时无法分配形状和数据类型为float32的数组

我正在尝试从Wikipedia文本数据中训练word2vec模型，因为我正在使用以下代码。导入日志记录导入os.path导入sys导入gensim.corpora导入的多处理...

python multiprocessing python-multiprocessing gensim word2vec

回答 1 投票 0

我们如何使用word2vec表示法实现单词义消歧？

我知道word2vec的工作原理，但是在寻找如何使用word2vec实现单词歧义消除时遇到了麻烦。您可以协助处理吗？

python nlp word2vec unsupervised-learning word-sense-disambiguation

回答 1 投票 0

如何在自训练的word2vec模型中删除单词

我有一个自训练的word2vec模型（2G，以“ .model”结尾。我将模型转换为文本文件（超过50G，以“ .txt”结尾），因为我必须在其他python代码中使用文本文件。我正在尝试...

python word2vec

回答 1 投票 0

如何逐步训练word2vec模型

我有一个超过40G的数据集。由于内存有限，令牌生成器的程序被杀死，因此我尝试拆分数据集。如何逐步训练word2vec模型，即如何使用单独的...

python word2vec

回答 1 投票 0

如何通过CBOW（GenSim）从一组输入单词中查找最相似的单词？

我使用GenSim和CBOW训练语料库。如何从一组输入单词中获得最相似的单词？例如：给定一组输入词：[“ David”，“ Mary”，“ married”]。我可以推断出一些...

gensim word2vec

回答 1 投票 0

gensim中的分批训练word2vec在多名工人的支持下

上下文存在一些有关如何使用gensim和流数据训练Word2Vec的问题。无论如何，这些问题没有解决流式传输不能使用多个工作程序的问题，因为...

python batch-processing gensim word2vec

回答 1 投票 0

有没有办法了解word2vec的输出功能？

我想了解word2vec输出中每个维度的含义。例如，如果我用一个热编码变量创建决策树，则可以准确分辨出分类中的哪个类别...

machine-learning word2vec word-embedding

回答 1 投票 1

word2vec中的类似单词是否有波兰语实现？

我找到了GoogleNews-vectors-negative300.bin库，但仅适用于ENG单词，在word2vec中是否有针对类似单词的波兰语实现？我已经尝试使用cc.pl.300.bin和NKJP -...

java nlp word2vec polish

回答 1 投票 0

Word2Vec二次采样—实现

我正在Pytorch和Tensorflow2中实现Skipgram模型。我对常用字的二次采样的实施方式有疑问。从本文的逐字记录中，...

keras word2vec tf.keras subsampling

回答 1 投票 0

用于Word2Vec模型测试的问题对（基本事实）数据集？

我正在寻找测试数据集来优化我的Word2Vec模型。我从gensim找到了一个很好的例子：gensim / test / test_data / questions-words.txt有人知道其他类似的数据集吗？谢谢！

machine-learning nlp word2vec word-embedding

回答 1 投票 -2

如何释放pyspark模型（JavaModel）占用的内存？

如上所述，我通过pyspark加载了经过训练的word2vec模型。 word2vec_model = Word2VecModel.load（“保存路径”）使用完后，由于要在...

python apache-spark pyspark nlp word2vec

回答 1 投票 0

如何向Word2vec gensim手动添加单词和向量？

假设word2vec.model是我训练有素的word2vec模型。当出现词汇量不足的单词（oov_word）时，我使用compute_vec（oov_word）方法计算向量vec。现在，我想添加/附加oov_word ...

gensim word2vec

回答 1 投票 0

显示1-d形状的2-d numpy ndarray

python pandas numpy word2vec

回答 1 投票 0

查找目标单词和中心word2vec矩阵

[我已经读过并听到（在斯坦福大学的CS224中），Word2Vec算法实际上训练了两个矩阵（即，两个向量集。）这两个是U和V集，一个是单词作为目标。 ..

nlp word2vec word-embedding

回答 1 投票 0

将GloVe向量导入gensim。 UnicodeDecodeError：'utf-8'编解码器无法解码位置0的字节0xe6：无效的继续字节

我使用自己的语料库，使用https://github.com/stanfordnlp/GloVe/blob/master/demo.sh提供的代码制作了GloVe向量。因此，我同时具有.bin文件和.txt文件向量。我正在尝试...

python gensim word2vec glove

回答 1 投票 0

如何将经过自我训练的word2vec保存到txt文件，其格式为'word2vec-google-news'或'glove.6b.50d'

[我不知道如何将经过自我训练的word2vec保存到txt文件，其格式为'word2vec-google-news'或'glove.6b.50d'，其中包含标记和匹配的向量。我导出了自己的...

machine-learning nlp word2vec word-embedding

回答 1 投票 0

为NLP应用迭代在Numpy数组上

我有一个正在构建的Word2Vec模型，我在那里有一个大约3万个单词的vocab_list。我有一个约150k的句子列表（sentence_list）。我正在尝试从...

python numpy nlp word2vec

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.