levenshtein-distance 相关问题

用于测量两个序列之间的差异量的度量。

计算2个句子之间的相似度

我想计算两个句子之间的相似度,我需要百分比值来表示它们彼此匹配“有多好”。像这样的句子, 1. 红狐狸在山上移动......

回答 5 投票 0

我可以按顺序使用这些因素的距离测量是什么?

我有几个列表,它们的 ID 都是字符串。它们如下: 列表1 = [“1”,“2”,“3”,“4”,“5”] list2 = ["1", "2&q...

回答 1 投票 0

Levenshtein 距离算法比 O(n*m) 更好?

我一直在寻找一种先进的编辑距离算法,到目前为止我发现的最好的算法是 O(n*m),其中 n 和 m 是两个字符串的长度。该算法之所以处于t...

回答 5 投票 0

如何确保 kNN 的 scikit 考虑到我的自定义距离度量?

我已经按照 SO(这里)的一些其他答案将自定义距离应用于我的 kNN 模型,但我认为它没有被考虑在内。 这是我的指标: def distance_fun(df, text_feat, num_feat):...

回答 0 投票 0

用于 Levenshtein 距离算法的 QWERTZ 键盘的加权距离矩阵

我有一个 Levenshtein 距离算法的权重矩阵,看起来像这样 int[,] 权重 = 新的 int[6, 6] { { 0, 1, 2, 1, 1, 2 }, { 1, 0, 1, 2, 1, 2 }, { 2, 1...

回答 1 投票 0

如何通过在不同列上应用 fuzzy_pandas merge 来匹配两个数据帧?

我有一个输入和一个主文件,我首先尝试使用 fpd.fuzzy_merge 函数进行精确匹配,这似乎工作得很好。之后,我想开始涂抹leven...

回答 1 投票 0

Function levenshtein(character varying, text) does not exist postgres

我不能在我的 postgres 查询中使用 levenshtein 函数 PostgreSQL 版本 == 14.1 我得到错误: asyncpg.exceptions.UndefinedFunctionError: function levenshtein(character varying, text) 确实...

回答 1 投票 0

如何使用列文斯丁距离作为标准对一个列表进行排序?

我想在一个窗口中显示几个字符串。我计算了所有这些字符串的列文斯丁距离,然后将它们添加到一个列表中。现在,我想把列表从字符串开始排序......

回答 1 投票 0

获取2个字段之间的共同字符串(Levenstein?

我需要获取两个字段之间的共同字符串。我可以用sql(postrgre)来做吗?先谢谢你。

回答 1 投票 0

获取2个字段之间的共同字符串(Levenstein?

我需要获取两个字段之间的共同字符串。我可以用sql(postrgre)来做吗? PS :这是一个假设的pourcentage,是给我的字段s2和s2的相似度,先谢谢你。

回答 2 投票 0

在导入数据前,在MySQL数据库列上使用php函数。

我使用mySQL和PHP已经有几个月了,正在为我的网站建立一个搜索功能。这个搜索功能有一个过滤器和一个搜索栏。过滤器目前由 ...

回答 1 投票 0

如何修改levenshtein编辑距离函数,使之更加灵活。

我正在寻找一个levenshtein编辑距离函数的版本,它有三个主要的不同之处。它适用于标记化的输入,所以代替'hello world'的是['hello', 'world']。所以每个字符...

回答 1 投票 0

替换、缺失和插入数的Levenshtein距离。

这里有一篇很棒的博文https:/davedelong.comlog20151201edit-distance-and-edit-steps关于Levenshtein的距离。我正试图实现这一点,也包括子、Dels和ins的计数 ...

回答 1 投票 0

在python中进行数据匹配(模糊,列文斯坦?)

我想做一些类似于excel模糊v-lookup的事情,但在python中。我有一个由大约10000个字符串组成的列表,比如:JohnSmith5159LosAngAng。JohnSmith5159LosAngelesJaneDo7729NewYork等等,我想看看... ...

回答 1 投票 -2

Python多个列表,保持相同,用变量代替差异。

我想比较一个未定义数量的具有相同长度的列表,并以相同的顺序创建一个新的相同长度的列表,其中相同的地方被保留,不相同的地方被替换为......

回答 1 投票 1

如何计算两个数据框中所有行之间的Levenshtein距离,并输出每个数据对的Levenshtein分数?

我想计算两个数据帧(dfa & dfb)之间的Levenshtein距离,如下所示。 dfa: 名称 地址 ID Name1a Address1a ID1a Name2a Address2a ID2a ...

回答 2 投票 0

运行Fuzzywuzzy时如何摆脱属性错误?

我正在尝试比较2个列表,并获取列表中每个项目的距离比。我下面的代码返回了一个属性错误:“系列”对象没有属性“模糊”。我该如何解决? '差异'...

回答 1 投票 0

寻找Revenshtein距离的详细代码,R [关闭]

我正在寻找R中的Levenshtein距离代码,但我一直在努力寻找一个。我在C,C ++中找到了一些,...在这里:http://rosettacode.org/wiki/Levenshtein_distance#C你知道我可以在哪里...

回答 1 投票 -1

查找整数列表中的簇数

让我们考虑距离d(a,b)=在a和b中成对不同的位数,例如:d(1003000000,1000090000)= 2#第四和第六位数字不匹配(我们仅使用10 -...

回答 1 投票 3

如何检查字符串在Python中是否包含子字符串的一部分?

给出字符串B,如何检查字符串A的序列是否适合字符串B的百分比很高(基于字符串B的长度,匹配字符为65%)。通常,我可以使用Levenshtein Distance,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.