word2vec 相关问题

该工具提供了用于计算单词的矢量表示的连续词袋和跳过 - 克结构的有效实现。这些表示随后可用于许多自然语言处理应用程序和进一步研究。

KeyError.当从文本文件中读取文本时,"单词'限制'不在词汇中"。从文本文件中读取的文本生成词嵌入向量时,出现 "词'限制'不在词汇中"。

我得到了这个错误: "KeyError: word 'restriction' not in vocabulary", 当我读取一个文本文件来生成单词嵌入向量时,而单词 "restriction "就在文本文件中。我想知道我的...

回答 1 投票 0

并行化对训练word2vec模型没有好处。

我尝试使用gensim库中实现的word2vec进行并行。我注意到,我越是增加线程,训练就越慢,我不知道为什么。有什么需要设置的吗?I ...

回答 1 投票 1

word2vec推荐系统KeyError: "单词'21883'不在词汇中"

代码对于包含500000+实例的数据集工作绝对正常,但每当我将数据集减少到50001000015000时,它就会抛出一个关键错误:单词 "***"不在词汇中。

回答 1 投票 0

如何从TFHub下载的预先训练好的word2vec模型中获取单词向量?

所以我使用了以下来自TFHub的word2vec模型: embed = hub.load("https:/tfhub.devgoogleWiki-words-250-with-normalization2") 这个对象的类型是: tensorflow.python.saved_model.load......

回答 1 投票 0

简单地打印单词向量,而不是以数组的形式获取。

一个非常简单的任务,但我似乎做不到。我想得到这样的向量:the -0.038194 -0.24487 0.72812 -0.39961 0.083172 0.043953 -0.39141 0.3344 -0.57545 0.087459 0.28787 -0.06731 0......。

回答 1 投票 -1

将字数组和向量数组组合以生成Gensim W2V模型

我有一个pickle文件中的单词数组,还有一个npy文件中的对应矢量数组,如何将它们组合起来以生成Gensim W2V模型?] >>

回答 1 投票 0

gensim word2vec词嵌入如何提取1个单词句子的训练单词对?

请参考下图(word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程)。例如。 “我爱你。” ==> [[I,love),(I,you)]请问单词是什么...

回答 1 投票 0

提高DOC2VEC Gensim效率

我正在尝试在带标签的文档上训练Gensim Doc2Vec模型。我大约有4000000个文档。以下是我的代码:将pandas作为pd导入从nltk.corpus导入多处理从...

回答 1 投票 1

损失函数的选择

[这是一个word2vec实现:%reset -f从torch.autograd导入torch。

回答 1 投票 2

未定义名称'doc2vec'

我正在尝试使用doc2vec进行文本分类,但是在导入后,当我试图在一个函数中使用它时,它说doc2vec未定义。请帮助我确定所有库...

回答 2 投票 0

从LDA模型对主题建模进行重新训练或重新分组的结果

我想知道是否有可能通过LDA模型中的输出主题重用单词,然后通过使用LDA模型或单词向量再次将它们重新分组为新的组?有人知道吗,我们...

回答 1 投票 0

Gensim以txt格式保存单词向量错误

我的问题如下。我有一些以txt格式保存的预训练向量,我将它们加载到dict中。但是当我在gensim中再次训练它们后尝试保存它们时,给了我一个错误,例如...

回答 1 投票 0

Gensim v3.6.0 Word2Vec DeprecationWarning:调用不推荐使用的`wv`(属性将在4.0.0中删除,改为使用self)

我正在使用Gensim 3.6.0加载预训练的Word2Vec,并且在调用model.wv时显示以下错误。 /anaconda/envs/python36/lib/python3.6/site-packages/ipykernel_launcher.py:1:...

回答 1 投票 0

无法使用gensim加载Doc2vec对象

我正在尝试使用gensim加载预先训练的Doc2vec模型,并使用它将段落映射到向量。我指的是https://github.com/jhlau/doc2vec,我下载的预训练模型是...

回答 1 投票 1

如何使用neo4j用单词向量创建词汇图?

我想用词向量创建词汇表。目的是基于单词相似度在词汇表中查询最近的单词。我们如何在neo4j上实现这一目标?以下是一个...

回答 1 投票 0

如何仅从word2vec类似单词列表中获取文本元素? python

我有这段代码,我要搜索的结果是一个数组,其中只有最相似列表中的单词。 model1.most_similar('Mercedes-Benz SLK-Class')[:5] [('BMW M4',0.9959905743598938),('...

回答 1 投票 0

手套文本预处理

我注意到技术上,人们将文本URL,数字和日期转换为。手套数据集是否已针对这些占位符进行过嵌入训练。我可以直接将它们输入数据集中吗?

回答 1 投票 0

如何在三个预训练模型之间比较余弦相似度?

我有两个语料库-一个包含所有女性领导讲话,另一个包含男性领导讲话。我想检验一个语料库中两个单词之间的余弦相似度为...

回答 1 投票 0

如何在python文件中设置PYTHONHASHSEED

我正在尝试在python文件中设置PYTHONHASHSEED = 0,而我的python版本是3.6。我正在使用Word2Vec模型“(Word2Vec(description,min_count = 1,size = 100,worker = 3,window = 3,sg = 1,seed = 0))”,我...

回答 1 投票 0

我如何将组词应用于自己的文本语料库?

我最近遇到了本文(https://arxiv.org/pdf/1605.09096.pdf),并且我一直在阅读GitHub(https://github.com/williamleif/histwords),但事实并非如此对我清楚...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.