cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

计算余弦相似度并将其保存到同一行的CSV文件中

我有两个 CSV 文件,我想比较它们以找出相似之处。这里我使用余弦相似度。第一个文件包含 2000 行关于每个候选人的简历,有 7 列:标题,位置......

回答 0 投票 0

在 Python 中识别大型字符串列表中的项目之间的文本相似性的最有效方法是什么?

下面的一段代码达到了我想要达到的结果。有一个名为“引理”的字符串列表,其中包含特定类别单词的可接受形式。另一个列表,cal...

回答 2 投票 0

使用 OpenSearch Java 客户端执行 KNN 近似搜索

我正在尝试使用 OpenSearch Java 客户端执行 KNN 近似搜索。 我找不到关于它的任何示例或文档(高级和低级客户端)。 我能够执行

回答 0 投票 0

“numpy.ndarray”对象不可调用余弦相似性

我正在按照在线教程确定文本相似度并使用余弦相似度来确定距离。但是,我不断得到 'numpy.ndarray' 对象不可调用 当我使用 cosine_simi 时...

回答 0 投票 0

pandas 中的行余弦相似度计算

我有一个看起来像这样的数据框: api_spec_id 标签 Paths_modified Tags_modified Endpoints_added 933 803.0 次要 8.0 3.0 ...

回答 2 投票 0

Class Hypervectors are too Similar (HDC)

我正在编写一个 HDC 示例,如 GitHub 链接和下面的代码所示。然而,该算法的准确率很低(通常为 50%-60%)。我不确定错误会在哪里......

回答 0 投票 0

iOS 中的矢量相似度搜索

是否有适用于 iOS 的矢量相似性搜索的实现? 我有一组 ~10K+ 向量。当我得到一个新向量时,我想从集合中找到最相似的前 K 个向量...

回答 1 投票 0

计算字符串之间的余弦相似度没有得到预期的结果

我想计算熊猫数据框同一行中的两个字符串之间的成对余弦相似度。 我使用了以下代码行: 将熊猫导入为 pd 来自 sklearn.

回答 1 投票 0

如何在 word2vec 中使用阿拉伯语?

我正在尝试使用此链接中的 word2vec 制作图书推荐系统 https://medium.com/@ashok.1055/building-book-recommendation-system-16f2cdf615f2 当我在

回答 1 投票 0

基于矩阵乘法检索文件。

我有一个模型,在多维向量空间中表示文档的集合。所以,例如,对于100k个文档,我的模型以300维向量的形式来表示它们。所以,...

回答 1 投票 0

量子化计算文件相似度时,如何排除重复计算?

我试图计算160个文档(dfm_daten)之间的余弦相似度,然后将它们以配对列表的形式输出到Excel中。代码:cosdocpair

回答 1 投票 0

如何根据预定义的语言类别来衡量一个文档的差异性?

我有3类词,分别对应不同类型的心理驱动力(权力需求、成就需求和亲和需求)。目前,在我的样本中,每一份文档(n=...

回答 1 投票 0

计算余弦相似度:ValueError:输入必须为1-d或2-d

希望每个人都很好。我正在尝试使用以下方法来有效地计算由(29805,40)稀疏矩阵的余弦相似度,该稀疏矩阵是由HashingVectorizing(Sklearn)我的数据集创建的。方法...

回答 1 投票 0

在余弦相似度中对数字施加的权重大于字符串

我有一个程序可以从Internet提取地址,并对照数据库进行检查。这很有用,但我现在正尝试引入一个相似性函数来比较互联网上的地址...

回答 1 投票 0

Keras余弦相似度-正或负

我正在训练模型,我的损失函数是余弦相似度:model.compile(optimizer ='adam',loss = tf.keras.losses.cosine_similarity,metrics = [tf.keras.metrics ....]

回答 1 投票 1

如何使用Tensorflow获得数组的所有元素与同一数组中的所有其他元素的余弦相似度

[给出形状为(1000000,512)的句子嵌入数组(512的数组),我如何计算该数组的100万个句子嵌入相对于...的余弦相似度]]] >> < [

回答 2 投票 0

spark数据帧(scala)中tf idf输出的余弦相似度

我正在使用Spark Scala计算数据帧行之间的余弦相似度。数据帧格式如下:根|-id:长(nullable = true)|-特征:矢量(nullable = true)...

回答 1 投票 0

余弦相似度= 1.0,即使源/输入字符串具有在语料库中看不到的额外标记?

我正在使用scikit-learn中的TfidfVectorizer和cosine_similarity。当我有一个新的字符串并尝试找到与原始训练语料库中的字符串的余弦相似度时,我注意到...

回答 1 投票 0

文件相似功能

我正在尝试为文档的余弦和欧氏距离创建矩阵。不太确定我将如何处理这个问题。任何意见,将不胜感激。谢谢。该函数采用...

回答 1 投票 0

将行变成字典Python

对于我的项目,我必须使用两个字典作为输入进行余弦相似度计算,其建立如下:table1 = {“

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.