word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

阿拉伯语/波斯语不能正确打印到屏幕上

我遵循这个教程,一切都很好,我预处理和训练我的模型但是当我想找到与下面的代码相似时:model = gensim.models.Word2Vec.load(“wiki.fa.word2vec.model”)...

回答 1 投票 1

将Python字典转换为Word2Vec对象

我已经获得了一个字典映射到他们在python中的向量的单词,我试图分散绘制最相似的单词,因为TSNE上的大量单词将永远消失。最好的选择是......

回答 2 投票 0

当我使用word2vec :: word2vec函数时,我反复退出R服务器中的会话

我已安装此软件包,并尝试在我的R服务器上使用word2vec。 library(devtools)install_github(“mukul13 / rword2vec”)model = word2vec(train_file =“text8”,output_file =“vec.bin”,binary = 1)...

回答 1 投票 1

将Word嵌入与来自LDA的主题词分发相结合,用于文本摘要

我是NLP的新手,我想知道通过考虑Word嵌入来总结已经通过LDA等方法分类到某个主题的文档是否是一个好主意...

回答 1 投票 -1

如何使用FastText处理不平衡的标签数据?

在FastText中,我有不平衡的标签。处理它的最佳方法是什么?

回答 2 投票 5

关于单词嵌入的问题(word2vec)[关闭]

我试图理解word2vec(字嵌入)架构,我对此几乎没有疑问:首先,为什么word2vec模型被认为是对数线性模型?是因为它在...时使用了最大值

回答 1 投票 1

word2vec中的命令行参数

我想用word2vec用英文维基百科的当前版本创建我自己的单词向量语料库,但我找不到使用该程序的命令行参数的解释。在......

回答 2 投票 3

Word嵌入,LookupTable,Word嵌入可视化

我需要问几个关于单词嵌入的问题.....可能是基本的。当我们将单词的一个热矢量例如king [0 0 0 1 0]转换为嵌入向量E = [0.2,0.4,0.2,0.2] ....

回答 1 投票 1

为什么word2vec胜过其他神经网络方法?

为什么word2vec胜过其他神经网络方法? Word2vec比其他神经网络方法(NNLM,RNNLM等)更浅。可以解释一下吗?我想知道它是否受到影响......

回答 1 投票 0

如何预测KeyedVectors word2vec的输出字?

gensim.models.Word2Vec类具有方法predict_output_word()。现在我使用prelearned模型,但它保存在类gensim.models.KeyedVectors中。有类模拟方法吗?或者我怎么能得到......

回答 1 投票 0

将文本文件中的单词列表转换为单词向量

我有一个包含数百万行的文本文件,我想将其转换为单词向量,稍后我可以将这些向量与搜索关键字进行比较,看看哪些文本更接近搜索...

回答 2 投票 0

使用AutoML评估算法Word2Vec的超参数

是否可以使用AutoML(来自H2O)仅使用Word2Vec算法并尝试不同的参数值,以找出哪些参数设置为我提供了最准确的向量...

回答 1 投票 0

CNN中的反向传播如何用于文本分类中的预训练嵌入

如果在训练期间未更新权重,则损失函数如何在预训练的word2vec嵌入的情况下起作用。那么后向传递如何工作以及它如何更新以进行预测?

回答 1 投票 0

使用word2vec.score.sg pair()引发Python错误 - 只有整数...整数或布尔数组是有效的索引

我正在尝试在python中实现word2vec,以便在一对单词上对训练过的Skip-gram模型进行评分。但我无法弄清楚错误:只有整数,切片(:),省略号(...),numpy.newaxis(无)...

回答 1 投票 0

Pyspark如何从word2vec单词嵌入中计算Doc2Vec?

我有一个pyspark数据框,其中包含大约300k个唯一行的语料库,每个行都有一个“doc”,每个文档包含几个文本句子。经过处理后,我有一个200维矢量化表示...

回答 2 投票 5

word2vec - 什么是最好的?添加,连接或平均单词向量?

我正在研究一种复发语言模型。要学习可用于初始化我的语言模型的单词嵌入,我使用的是gensim的word2vec模型。经过训练,word2vec模型拥有两个......

回答 3 投票 6

如何从预训练模型中获得Gensim中的word2vec训练损失?

我有一些预先训练过的word2vec模型,我想用相同的语料库来评估它们。有没有办法在模型转储文件和内存中的语料库中获得原始训练损失?

回答 1 投票 0

使用node2vec创建嵌入

我正在尝试为使用networkx和node2vec的边缘列表创建嵌入。我的边缘列表如下所示:1 2 1 6 ... 450 230 ... 601 602这是一个未加权的无向图,基本上......

回答 1 投票 1

word2vec向量的Keras输入规范

我阅读了有关此主题的所有其他答案,但我的用例略有不同。我有一个numpy阵形(800,128,1)。 800个元素中的每个元素都存储了一个word2vec嵌入...

回答 1 投票 0

如何在Keras中使用数组列表指定一个嵌入层的输入?

我正在尝试做一些单词级别的文本生成并坚持使用以下问题:我的输入看起来像这样:tokenized_seq = [[w2v_model.wv.vocab [word] .index for w2v_data [i]中的单词] for i in ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.