cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

删除TFIDF结果的同义词在python中

我目前正在从事一个项目,该项目使用python中的tfidf获得文档集中最相关的10个单词。但是,在相同的单词及其复数形式或副词形式上会有结果...

回答 1 投票 0


如何在语义上比较两个句子?

我正在尝试为大学构建一个应用程序,以便学生可以在其上进行考试,但是我遇到了文章问题,我无法将学生的答案与...的答案进行比较。]] >

回答 1 投票 1

如何对某些术语进行额外加权的TF-IDF评分

我目前有一个tf-idf系统用于评分,并且我使用余弦相似度进行搜索。我想添加额外的权重,以考虑给定术语是否位于...

回答 1 投票 0

余弦相似度图混杂在一起,名称一起运行

我有一小部分要绘制余弦相似度的文档。文档名称很长,我不知道如何防止它们在绘图上一起运行。这是文件名...

回答 2 投票 0

TensorFlow:整个训练过程中的CosineDifference ObjFunc常数

以下示例是我正在研究的简化版本。我正在尝试找到一个最小化余弦距离的神经网络。我实现自己的余弦差的原因...

回答 1 投票 0

如何使用tfidf矢量化程序比较两个文本文档?

我有两个不同的文本,我想使用tfidf向量化进行比较。我正在做的是:使用TFIDFVectorizer.fit_transform(tokens_list)对每个文档进行矢量化标记现在,这些矢量...

回答 1 投票 0

余弦相似度预处理任务

我最近开始使用NLP。作为余弦相似度计算的一部分,我必须完成以下任务:#将句子转换成词袋向量。 send_1 = dictionary.doc2bow(...

回答 1 投票 -1

根据许多文档计算文本相似度

我正在尝试针对其他搜索字词集合计算搜索字词A的文本相似度,例如“如何制作鸡”。为了计算相似度,我使用了余弦距离和TF-IDF来...

回答 1 投票 0

组内计算余弦相似度

我有一个数据行,其中包含如下所示的行。我的目标是计算同一类别中每一行与每一行的余弦相似度,这样我最终得到一个...

回答 1 投票 0

如何在3000-4000字的大型文档中进行语言表示以进行基于查询的检索?

我正在尝试进行语义搜索,以从非结构化法语文档的数据集中检索相似的文档。这些文档未分类,并且是包含300-3000个单词的模板...

回答 1 投票 0

[使用tf-idf-Python的文档之间的余弦相似度和TS-SS相似度

计算基于文本的文档之间的余弦相似度的一种常见方法是计算tf-idf,然后计算tf-idf矩阵的线性核。 TF-IDF矩阵使用...

回答 1 投票 1

如何:数组内的余弦相似度的平方根〜java〜

我的问题是,我正在创建一个图书推荐系统,当我尝试对平方进行平方根以确定相似度时。我不认为这是每个数组所有内容的平方根。...

回答 2 投票 -2

Keras BinaryCrossentropy损失给出两个向量之间的角距离为NaN

我想训练一个暹罗-LSTM,以便如果相应的标签为0,两个输出的角距离为1(低相似度),如果标签为1,则两个输出的角距离为0(高相似度)。

回答 1 投票 0

余弦相似度VS余弦距离,有什么区别?

看起来像scipy.spatial.distance.cdist余弦相似距离:链接至cos相似度1 1-u * v /(|| u |||| v ||)与sklearn.metrics.pairwise.cosine_similarity不同链接到...

回答 1 投票 1

scipy.spatial.distance.cdist(cosine)与sklearn.metrics.pairwise.cosine_likeity

看起来像scipy.spatial.distance.cdist余弦相似距离:链接至cos相似度1 1-u * v /(|| u |||| v ||)与sklearn.metrics.pairwise.cosine_similarity不同链接到...

回答 1 投票 0

BigQuery-查找N个最近的向量

我有一个bigquery表,其中有一列具有512维向量(浮点数)的重复数据类型。我想运行一个查询,查找N个最相似的向量。就我而言,相似性...

回答 1 投票 0

sklearn linear_kernel产生余弦相似度-内存错误

我正在尝试使用sklearn TfidfVectorizer查找余弦相似度,因为数据量很大,我一直在遇到内存错误tf = TfidfVectorizer(analyzer ='word',ngram_range =(1,3),...] >

回答 1 投票 0

余弦相似度慢

我有一组句子,使用句子编码器将其编码为向量,并且我想找出与传入查询最相似的句子。搜索功能如下:def ...

回答 1 投票 1

如何在具有向量的情况下将关键字聚类或获得关键字相似度

[我有一个Python字典,使用Pickle方法(通过Bert-as-Service和Google的预训练模型)存储为矢量文件,例如:(key)Phrase:(value)Phrase_Vector_from_Bert = woman cloth:1 ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.