string-matching 相关问题

字符串匹配是在另一个字符串(“text”,“haystack”)中查找一个字符串(“pattern”,“needle”)的问题。

我可以组合 contains 和startswith 来将一个数据帧中的两列匹配到另一个数据帧的主列吗?

大家好。我正在努力解决这个问题,但我没有找到任何类似的东西。 主数据框包含特定比赛的球员和统计数据。 34 列和可变数量...

回答 1 投票 0

R 中的快速部分字符串匹配

给定一个字符串文本向量和一个模式向量,我想找到每个文本的任何匹配模式。 对于小型数据集,这可以在 R 中使用 grepl 轻松完成: 模式= c(“所以...

回答 3 投票 0

极性:将函数应用于过滤字符串列的有效方法

我有一列长字符串(如句子),我想对其执行以下操作: 替换某些字符 创建剩余字符串的列表 如果字符串是所有文本,请查看它是否在

回答 1 投票 0

如何找到偶数个“后的第一个#?

读取以下格式的文本文件: “bbbbbb”,#“旧”,“uio”, “ sds # sds”,#“old2”, “ sds # sds”,“ a # b”,#“old2”, ...

回答 1 投票 0

使用数组中的键搜索字符串并返回第一个符合条件的键的值

我有一个像这样的数组: $array = ['猫' => 0, '狗' => 1]; 我有一个像这样的字符串: $string = '我喜欢猫。'; 我想看看在字符串中是否找到了数组中的任何键;如果是这样,我...

回答 4 投票 0

Python中的高性能模糊字符串比较,使用Levenshtein或difflib

我正在进行临床消息标准化(拼写检查),其中我根据 900,000 字的医学词典检查每个给定的单词。我更关心时间复杂度/性能。 我想要...

回答 2 投票 0

两个数据帧之间文本字符串的不对称部分匹配

我有两个数据框: df1 基于调查回复,并包含一个非限制字段,供用户添加其在英国的位置(或拒绝这样做),格式如下(非真实数据): 姓名 洛...

回答 1 投票 0

分割文件名,只取一部分使用

我有一个 $value,例如 22214-HAV.jpg 或 22214 HAV.jpg(注意没有破折号) 我想运行一个快速函数来仅从文件名中提取数字。

回答 3 投票 0

字符串模式匹配问题

想象我们有一个长字符串,其中包含子字符串“cat”和“dog”以及其他随机字符,例如。 猫×狗 猫×猫×狗×狗×猫×狗×猫 这里'x'代表任何随机序列...

回答 1 投票 0

如何检测字符串内相同的部分?

我尝试将解码算法想要的问题分解为更小的问题。这是第一部分。 问题: 两个字符串:s1 和 s2 s1 的一部分与 s2 的一部分相同 空格是分隔符 如何

回答 4 投票 0

“用户友好”.net 兼容的正则表达式/文本匹配工具?

目前在我们的软件中,我们提供了一个钩子,我们可以调用客户端构建的 DLL 来解析我们正在处理的文档中的信息(DLL 接受一些文本(或文件)并返回一个 li...

回答 1 投票 0

如何匹配以逗号分隔的可变项目列表

我想把这样的东西变成这样 CS 240、CS 246、ECE 222,...(或多或少);仅限软件工程专业的学生 进入 (“CS 240”、“CS 246”、“ECE 222”、“ECE 220”) 在 Python 中,与

回答 3 投票 0

在 R 中拆分逗号和分号分隔的字符串

我正在尝试拆分包含两个条目的字符串,每个条目都有特定的格式: 类别(例如活动站点/区域),后跟: 术语(例如 His、Glu/核苷酸结合基序 A)

回答 2 投票 0

在 Javascript 中,当用户键入时突出显示设置单词,同时保持光标位置[关闭]

我正在尝试在网页上制作一个超级简单的编辑器,当用户输入文本时,它会自动突出显示大型猫科动物的名字。 该脚本的要点如下: 当用户嗨...

回答 1 投票 0

将电话号码匹配纳入现有基于字符串的姓名匹配功能

我有一个 Python 函数 match_strings,它旨在匹配来自两个不同数据源的名称。这是函数定义: Python def match_strings(strings1, strings2, ngram_n=2,

回答 1 投票 0

有没有一种方法可以根据每个值中出现的两个关键字或短语将字符串向量重新编码为具有这两个值的新向量?

正如我的问题所示,我想将字符串向量转换为每个字符串中出现的两个值之一的新向量。这是我拥有的一个非常简单的数据框的示例: 数据&...

回答 1 投票 0

基于多个标准的过滤范围

我正在尝试根据多个关键字过滤属性列表(例如“酷室内”、“露台/露台”)。这是一个基本的解释: 我要过滤的范围位于...

回答 1 投票 0

基于多个标准的过滤范围(Google 表格)

我正在尝试根据多个关键字过滤属性列表(例如“酷室内”、“露台/露台”)。这是一个基本的解释: 我要过滤的范围位于...

回答 1 投票 0

使用正则表达式查找具有相似性的文本

我识别了不同 PDF 文档中的文本列表。现在我需要使用正则表达式从每个文本中提取一些值。我的一些模式是这样的: 一些文字[ -]?(.+)[ ,-]+...

回答 1 投票 0

C语言的Aho-Corasick算法

我编写了一个带有转换表的 Aho-Corasick 算法,该算法在文本中搜索一组单词并使用 malloc() 显示出现次数,但我遇到了这个 e...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.