similarity 相关问题

相似性度量量化了对象(例如文档,特征向量)的相似程度。

Python:如何删除重复/类似的行

我有一个包含大量消息的文件。每行都是一个独特的消息,它们的结构相似,略有修改。一个例子如下:第10行的错误号609 ......

回答 2 投票 0

如何提高数据帧内字符串相似度得分的计算速度?

我有一个数据框如下:df = pd.DataFrame(data = [[1,'Berlin',],[2,'Paris',],[3,'Lausanne',],[4,'Bayswater', ],[5,'桌湾',],[6,'北京',],......

回答 1 投票 0

在Python中获取文本和集合文本之间的相似性

我正在为Twitter构建一个事件检测器,它受到垃圾邮件的极大影响,所以我打算用文本相似度算法过滤一下推文。我认为的方法......

回答 1 投票 0

有效地计算大的相似度矩阵

在我目前正在工作的项目中,大约有200,000名用户。对于这些用户中的每一个,我们针对其他用户定义了相似性度量。这产生200000x200000的相似性矩阵。一个 ...

回答 4 投票 1

如何在Python中计算包含字符串的两个列表的Jaccard相似度?

我有两个用户名列表,我想计算Jaccard相似度。可能吗?这个帖子展示了如何计算两个字符串之间的Jaccard相似度,但是我想应用...

回答 7 投票 9

检查图像与OpenCV的相似性

OpenCV是否支持两个图像的比较,返回一些值(可能是百分比),表示这些图像有多相似?例如。如果相同的图像被传递两次,将返回100%,...

回答 4 投票 124

Python字符串匹配完全等于Postgresql相似度函数

我一直在PostgreSQL中使用pg_trgm模块的相似性函数,现在我正在寻找类似于Python中的Similarity的单词相似度函数。我在python中找到了很多方法,例如...

回答 2 投票 1

搜索数组中的类似/最相似的字符串Java

我正在开发一个项目,我在XML文件中有书名。然后解析它们并将其转换为书籍对象的数组列表。现在我想搜索它们。我已经成功了......

回答 2 投票 0

将药物 - 基因相互作用列表转换为R中的相似性矩阵

我有一个交互列表,其中第一列包含不同的药物,第二列包含药物与之相互作用的基因。例如下面的代码:DGIdbpractice

回答 1 投票 0

K-Means距离测量 - 大数据和混合尺度

我有一个关于k-means聚类的问题。我们有一个包含120,000个观测值的数据集,需要用R计算k均值聚类解。问题是k-means通常使用欧几里德...

回答 4 投票 1

阻止的逆过程

我使用lucene雪球分析仪进行干预。结果不是有意义的话。我提到了这个问题。其中一个解决方案是使用包含...之间的映射的数据库。

回答 4 投票 8

找出R中的余弦相似度

我有两个csv文件,这两个文件的第一列中的字符最多可运行50000个变量。我必须计算两个文件的这些列之间的余弦相似度。我试过用......

回答 1 投票 -1

如何使用RDKit计算分子指纹和SMILE结构列表的相似性?

我正在使用RDKit来计算基于具有SMILE结构的两个分子列表之间的Tanimoto系数的分子相似性。现在我能够从两个独立的csv中提取SMILE结构...

回答 1 投票 1

查找具有相似文本的文章的算法

我在数据库中有很多文章(标题,文字),我正在寻找一种算法来找到X最相似的文章,比如Stack Overflow的“相关问题”,当你提出问题时。一世 ...

回答 15 投票 59

找到2df python之间的值的相似性

在python中,我的工作有问题。我试图将我的数据框更改为列表并找到结果,但它不起作用。我的输入有2个pandas.dataframe。我想找到...的相似之处

回答 1 投票 -1

如何以完全向量化的方式确定多行中的行相等?

我有一个numpy.ndarray叫做大小分组(S,N)。每行分组为我提供了数据样本的组标签。我运行我的算法S次并在每次迭代中获得新的组标签。一世 ...

回答 3 投票 4

如何计算给定2个字符串的距离相似性度量?

我需要计算2个字符串之间的相似度。那究竟是什么意思呢?让我用一个例子来解释:真实的词:医院错误的词:haspita现在我的目标是确定多少...

回答 7 投票 54

是否有一个替代`difflib.get_close_matches()`来返回索引(列表位置)而不是str列表?

我想使用像difflib.get_close_matches这样的东西,而不是最相似的字符串,我想获得索引(即列表中的位置)。列表的索引更多......

回答 1 投票 3

考虑到每对单词的相似性,如何衡量两个文档的相似度?

我有两个文件,例如:Doc1 = {'python','numpy','机器学习'} Doc2 = {'python','pandas','tensorflow','svm','regression','R'我也知道每个人的相似性(相关性)......

回答 1 投票 0

在Django模型中使用Trigram(gin_trgm_ops)创建Gin索引

django.contrib.postgres的新TrigramSimilarity功能非常适合我遇到的问题。我将它用于搜索栏以找到难以拼写的拉丁名字。问题是有超过2 ...

回答 3 投票 10

© www.soinside.com 2019 - 2024. All rights reserved.