cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

pandas 中的行余弦相似度计算

我有一个看起来像这样的数据框: api_spec_id 标签 Paths_modified Tags_modified Endpoints_added 933 803.0 次要 8.0 3.0 ...

回答 2 投票 0

Class Hypervectors are too Similar (HDC)

我正在编写一个 HDC 示例,如 GitHub 链接和下面的代码所示。然而,该算法的准确率很低(通常为 50%-60%)。我不确定错误会在哪里......

回答 0 投票 0

iOS 中的矢量相似度搜索

是否有适用于 iOS 的矢量相似性搜索的实现? 我有一组 ~10K+ 向量。当我得到一个新向量时,我想从集合中找到最相似的前 K 个向量...

回答 1 投票 0

计算字符串之间的余弦相似度没有得到预期的结果

我想计算熊猫数据框同一行中的两个字符串之间的成对余弦相似度。 我使用了以下代码行: 将熊猫导入为 pd 来自 sklearn.

回答 1 投票 0

如何在 word2vec 中使用阿拉伯语?

我正在尝试使用此链接中的 word2vec 制作图书推荐系统 https://medium.com/@ashok.1055/building-book-recommendation-system-16f2cdf615f2 当我在

回答 1 投票 0

基于矩阵乘法检索文件。

我有一个模型,在多维向量空间中表示文档的集合。所以,例如,对于100k个文档,我的模型以300维向量的形式来表示它们。所以,...

回答 1 投票 0

量子化计算文件相似度时,如何排除重复计算?

我试图计算160个文档(dfm_daten)之间的余弦相似度,然后将它们以配对列表的形式输出到Excel中。代码:cosdocpair

回答 1 投票 0

如何根据预定义的语言类别来衡量一个文档的差异性?

我有3类词,分别对应不同类型的心理驱动力(权力需求、成就需求和亲和需求)。目前,在我的样本中,每一份文档(n=...

回答 1 投票 0

计算余弦相似度:ValueError:输入必须为1-d或2-d

希望每个人都很好。我正在尝试使用以下方法来有效地计算由(29805,40)稀疏矩阵的余弦相似度,该稀疏矩阵是由HashingVectorizing(Sklearn)我的数据集创建的。方法...

回答 1 投票 0

在余弦相似度中对数字施加的权重大于字符串

我有一个程序可以从Internet提取地址,并对照数据库进行检查。这很有用,但我现在正尝试引入一个相似性函数来比较互联网上的地址...

回答 1 投票 0

Keras余弦相似度-正或负

我正在训练模型,我的损失函数是余弦相似度:model.compile(optimizer ='adam',loss = tf.keras.losses.cosine_similarity,metrics = [tf.keras.metrics ....]

回答 1 投票 1

如何使用Tensorflow获得数组的所有元素与同一数组中的所有其他元素的余弦相似度

[给出形状为(1000000,512)的句子嵌入数组(512的数组),我如何计算该数组的100万个句子嵌入相对于...的余弦相似度]]] >> < [

回答 2 投票 0

spark数据帧(scala)中tf idf输出的余弦相似度

我正在使用Spark Scala计算数据帧行之间的余弦相似度。数据帧格式如下:根|-id:长(nullable = true)|-特征:矢量(nullable = true)...

回答 1 投票 0

余弦相似度= 1.0,即使源/输入字符串具有在语料库中看不到的额外标记?

我正在使用scikit-learn中的TfidfVectorizer和cosine_similarity。当我有一个新的字符串并尝试找到与原始训练语料库中的字符串的余弦相似度时,我注意到...

回答 1 投票 0

文件相似功能

我正在尝试为文档的余弦和欧氏距离创建矩阵。不太确定我将如何处理这个问题。任何意见,将不胜感激。谢谢。该函数采用...

回答 1 投票 0

将行变成字典Python

对于我的项目,我必须使用两个字典作为输入进行余弦相似度计算,其建立如下:table1 = {“

回答 1 投票 0

为什么与库结果比较时得到余弦相似度不同的结果

我尝试使用余弦距离(源)来计算两个单词的相似度。这是代码:def word2vec(word):从集合中导入从数学中导入计数器从sqrt#计数...

回答 1 投票 0

如何解决fastfast-model300的下载问题?

我正在使用Windows 10和python 3.3。我尝试下载fasttext_model300来计算文档之间的软余弦相似度,但是当我运行python文件时,到达此位置后它就停止了...

回答 1 投票 0

根据Gensim模型计算余弦相似度

我正在尝试通过Gensim LDA主题模型计算主题间的余弦相似度得分,但这比我最初预期的要复杂。 Gensim有一种计算距离的方法...

回答 1 投票 0

Scipy余弦相似度与sklearn余弦相似度

我注意到scipy和sklearn都具有余弦相似度/余弦距离函数。我想测试每个向量对的速度:setup1 =“将numpy导入为np; arrs1 = [np.random ....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.