fuzzy-search 相关问题

一种搜索机制,其目标是找到搜索关键字的所有近似,相关或可能相关的结果,而不是找到完全匹配。

Python 中二进制字符串的快速模糊测试

我有一个二进制字符串,看起来像这样“000000000010011101010110111010000100001111110010010000011000001111101101”。我正在尝试找到创建模糊版本的最有效方法......

回答 1 投票 0

模糊句子搜索算法

假设我有一组短语 - 大约 10 000 - 平均长度 - 7-20 个单词,我想在其中找到一些给定的短语。我正在寻找的短语可能有一些错误 - 例如错过一个...

回答 2 投票 0

如何在 Python 中的较长字符串中找到字符串的所有精确出现或紧密匹配?

目标: 我想在 Python 中的较长字符串中找到字符串的所有精确出现或紧密匹配。 我还想知道这些出现在较长字符串中的位置。 为了定义...

回答 1 投票 0

模糊搜索 - 如何将搜索与多个功能/列相匹配?

我有一个包含 3 个特征的数据集:汽车的版本、型号和品牌。如何应用模糊搜索(使用 Python)来查看用户输入的内容是否与版本、型号、品牌或部分/全部匹配...

回答 1 投票 0

带有 $containsi(不区分大小写)参数的 Strapi 过滤器,不适用于西里尔语

我有西里尔字母的名称字段,并尝试使用 $containsi 参数通过该字段进行搜索 fetch("https://example.com/api/products?filters%5B$or%5D%5B0%5D%5Bname%5D%5B$containsi%5D=%D0%B3%D1%80&

回答 1 投票 0

基于大量行(>50 000)的模糊匹配删除“几乎重复”的字符串行

我有 50 000 个单词,例如: 添加 加上 鸡 一只鸡 吃鸡 去吃 ... 我想删除与其他线具有高度模糊相似性的线。 那么输出应该是: 添加...

回答 2 投票 0

在 Typesense 中,当我搜索“brd”时,它没有显示任何结果。为什么它不显示像鸟、吟游诗人等结果?

在typesense中,为什么模糊搜索不适用于小单词(len 4)? const 搜索参数 = { 'q': "brd", 'query_by': '标题', } 输出: { “facet_counts”:[], &q...

回答 1 投票 0

索引中的模糊阿拉伯语搜索

我尝试使用弹性搜索模糊搜索功能和阿拉伯语搜索查询。 有关它的更多详细信息在这里: https://www.elastic.co/guide/en/elasticsearch/reference/current/common-options.html#fuzzi...

回答 1 投票 0

spaCy 模糊匹配错误:“不允许额外字段”

我正在尝试运行spaCy的模糊匹配方法。我对 spaCy 包和模型 en_core_web_sm 使用 3.5.0 版本。 我运行了以下命令: 导入spacy 来自 spacy.matcher 我...

回答 2 投票 0

使用模糊搜索在 Vim 中打开文件

我正在寻找一种方法,使 Vim 能够通过模糊搜索文件名来打开文件。 基本上,我希望能够定义一个项目一次,然后有一个快捷方式,这将为我提供...

回答 5 投票 0

匹配来自不同系统的字符串的最佳方式

假设我有一个像这样的字符串列表(真实的数据集要大得多并且还包含其他数据): 列表 模型名称 = [ “XC60动力标准T6”, ...

回答 1 投票 0

如何在 Hibernate search 6 中获取结果集的亮点?

我在我的 java 应用程序中使用 Hibernate search 6 Lucne 后端。 我正在执行各种搜索操作,包括模糊搜索。 我得到的搜索结果没有任何问题。 现在我想要...

回答 1 投票 0

将相似的文本分组?

我有一份土地所有者列表,突出显示的内容都会显示类似的文本字符串。这些突出显示的分组是相同的土地所有者,但文本字符串略有不同。我在想也许可以...

回答 1 投票 0

大型术语列表的高效文本搜索:Python vs PostgreSQL vs Elasticsearch

我有一个列表,其中包含长度从 1 到 10 个单词不等的术语,大约有 500,000 个条目。我的目标是在长文本中搜索这些术语(从 PDF 转换而来,通常为 1.5 t...

回答 1 投票 0

对 tsvector 中的每个元素使用 Levenshtein 函数?

我正在尝试使用 Postgres 创建模糊搜索,并一直使用 django-watson 作为基本搜索引擎来工作。 我有一个名为 search_tsv 的字段,它是一个包含所有...

回答 1 投票 0

在 Flask 和 Flask-SQLAlchemy 中搜索产品

我目前正在使用 Flask 和 Flask-SQLAlchemy 构建移动应用程序的后端。 我目前陷入了一个功能中。 我在 Postgres 数据库中有一个使用 Flask-SQLAl 创建的 Products 表...

回答 1 投票 0

使用模糊正则表达式提取命名组和非命名组

我正在寻找一种将正则表达式应用于文本并以字典的形式提取其值的方法。 正则表达式中的组可以是命名的、未命名的或混合的。 理想情况下,我会使用模糊匹配...

回答 1 投票 0

使用 `regex` 进行 Python 模糊字符串搜索

尝试理解与正则表达式的模糊模式匹配。我想要的:我有一个字符串,我想在其他可能更大的字符串中找到相同或相似的字符串。 (数据库中有一个字段

回答 1 投票 0

查找近似字符串匹配并替换为预定义字符串的有效方法

我需要构建一个NER系统(命名实体识别)。为简单起见,我通过使用近似字符串匹配来完成此操作,因为输入可能包含拼写错误和其他细微修改。我来了...

回答 1 投票 0

是否可以在 Windows 10 git-bash 中使用 fzf(命令行模糊查找器)?

我下载了 .exe 文件并将其放入我的 PATH 变量中。 fzf 似乎可以在命令提示符下工作。但我想在 git-bash 中使用它。当我在 git-bash 中使用 fzf 时,它似乎启动了,但什么也没有

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.