levenshtein-distance 相关问题

用于测量两个序列之间的差异量的度量。

Levenshtein找不到俄语单词

我有一个脚本,使用Levenshtein在数据库中搜索单词。当我搜索英语单词时,一切都很好,但是当我搜索俄语单词时,MySQL控制台给出了...

回答 1 投票 1

第一次满足条件后停止嵌套的for循环

我有两个列表。我想与莱文施泰因距离进行比较。第一个列表(raw_1)是嵌套列表。我想将第二个列表(List)与(raw_1)中的嵌套列表的每个项目进行比较。如果...

回答 1 投票 0

确定序列中下一个字符的有效选项

说我有正则表达式const字符串regex =“ [A-Za-z0-9] * [0-9] {1,3} [A-Za-z] *?[A-Za-z] *” ; const字符串地址=“芝麻街123号ABC”; //这是有效的匹配项,到目前为止,我已经输入了“ ABC 123 ...

回答 1 投票 2

在Linux中是否有基于多列的模糊匹配命令

我有两个csv文件。文件1 D,FNAME,MNAME,LNAME,GENDER,DOB,快照2,66M,J,Rock,F,1995,201211.0 3,David,HM,Lee,M ,, 201211.0 6,66M ,, Rock,F ,, 201211.0 0,David,HM,Lee ,, 1990,201211.0 3,Marc,H,Robert,M,...

回答 1 投票 0

在Linux中是否有任何命令可以进行模糊匹配

我有两个csv文件。文件1 D,FNAME,MNAME,LNAME,GENDER,DOB,快照2,66M,J,Rock,F,1995,201211.0 3,David,HM,Lee,M ,, 201211.0 6,66M ,, Rock,F ,, 201211.0 0,David,HM,Lee ,, 1990,201211.0 3,Marc,H,Robert,M,...

回答 1 投票 0

通过文字和显示的变化差异比较字

可以标记为重复,但我还没有找到一个妥善的解决办法呢。我需要编写一个通过文字比较2个字的文本,并打印出的文本显示功能添加/删除/ ...

回答 4 投票 1

我怎样才能找到1距离内的字典串的变化?

假设你已经扫描与它名字的文件。由于在扫描过程中的错误,你要查找的名字在字典中。因此,你需要一个函数,在可能的名称...

回答 1 投票 -1

在r中使用stringdist进行字符串匹配?

我想匹配,然后将字符串替换为最接近的匹配。我正在使用stringdist库。下面是我的代码stringdistmatrix(“2 ltr thums up”,c(“solar thyme 30g”,“Thums Up 2 L”),...

回答 1 投票 1

在编辑距离内查找长字符串中的单词,忽略空格

我正在寻找一种算法,在忽略空格的同时,在查询字符串中有效地搜索给定编辑距离内的单词。对于例如如果我需要建立索引的话是:OHIO,......

回答 1 投票 0

汉明距离与Levenshtein距离

对于我正在研究的问题,找到两个序列之间的距离来确定它们的相似性,序列顺序非常重要。但是,我所拥有的序列长度不一样,......

回答 2 投票 40

Levenshtein与指数0的距离

我一直在研究“算法设计手册”一节8.2.1通过递归编辑距离。在本节中,Skiena写道,“我们可以使用观察来定义一个递归算法......

回答 1 投票 4

如何使用T-SQL中两个不同表的值来调用Levenshtien函数

我试图找到两个不同表TableA和TableB的列之间的Levenshtien距离。基本上我需要将TableA的ColumnA与TableB中的ColumnB的所有元素进行匹配...

回答 1 投票 0

Excel模糊查找中使用的算法

我正在研究匹配两套公司名称。我试图用Levenstien的距离用Python编写代码。我遇到了公司简称的问题,以及像Pvt这样的尾随部分......

回答 1 投票 0

Mysql全文搜索,自然语言模式:按“亲密度”排序

我正在使用MYSQL的FULL TEXT搜索功能(在Mysql 5.6.33中)。如果我在自然语言模式下进行比赛,对于具有单字符拼写错误的邮政编码,我会得到一些不错的结果,包括......

回答 1 投票 1

获得最接近的字符串匹配

我需要一种方法来将多个字符串与测试字符串进行比较并返回与它非常相似的字符串:测试字符串:棕色的狐狸在红色COW选择中跳过A:红色的COW在......

回答 10 投票 377

Python:在矩阵中查找Levenshtein编辑距离的有效方法

我想确定两个列表之间的相似性,之后我想要进行描述聚类。 L2D1 L2D2 L2D2 ......... L2Dn L1D1 0 0.3 0.8 ............ 0 ....

回答 1 投票 0

匹配产品字符串的最佳机器学习技术

这是一个难题......我有两个相同50000+电子产品的数据库,我想将一个数据库中的产品与另一个数据库中的产品相匹配。但是,产品名称并不总是相同的。 ...

回答 2 投票 31

如何配置Solr使用Levenshtein近似字符串匹配?

Apaches Solr搜索引擎是否提供近似字符串匹配,例如通过Levenshtein算法?我正在寻找一种通过姓氏查找客户的方法。但我无法保证......的正确性。

回答 2 投票 8

找到编辑距离的变化只有插入和删除?

我需要找到一个单词和它的排序单词之间的编辑距离(例如:apple和aelpp),只使用递归插入和删除。我找到了一些使用插入,删除,...的来源

回答 1 投票 1

Python中的高性能模糊字符串比较,使用Levenshtein或difflib [关闭]

我想做模糊字符串比较,但与使用哪个库混淆。选项1:导入Levenshtein Levenshtein.ratio('hello world','hello')结果:0.625选项2:导入difflib difflib ....

回答 2 投票 104

© www.soinside.com 2019 - 2024. All rights reserved.