regex 相关问题

正则表达式提供了一种声明性语言来匹配字符串中的模式。它们通常用于字符串验证,解析和转换。由于正则表达式未完全标准化,因此具有此标记的所有问题还应包含指定适用的编程语言或工具的标记。注意:要求HTML,JSON等正则表达式往往会遇到负面反应。如果有解析器,请使用它。

正则表达式中的空白问题

我正在使用一个简单的 Perl 脚本来解析 XML 并将其转换为可用的 SQL。我当前的 SQL 行是这样的: INSERT INTO 表VALUES ('data1', 'data2', 'data3', ); 显然我需要

回答 3 投票 0

使用正则表达式提取某些文本的两个条件

我的代码不起作用: regexp_substr('Lorem ipsum dolor sat amet.consectetur', '([^(.|()]+)|((.){0,9})') 文本应该以点结尾,如果没有点,那么它应该有一个格言...

回答 1 投票 0

使用 gsub 根据特殊字符分割名称

我有以下名字,我正在尝试将其更改为名字、姓氏格式。 我的名字Dup “克罗斯 K / 克罗斯 M” “戴维斯 L/哈珀 C” “威廉姆斯 M / 棕色 MG"...

回答 1 投票 0

Google Sheets 正则表达式不一致模式

附件是输入和预期输出,基于这些我想要一个可在 Google Sheets 中使用的通用正则表达式模式: 例子: 如果单元格中存在以下字符串: “30m DEVO-67,D...

回答 1 投票 0

正则表达式删除序数

我需要通过正则表达式删除序数,但我的正则表达式技能相当缺乏。下面的代码定位序数,但在返回值中包含前面的数字。我需要隔离并移除 j...

回答 6 投票 0

匹配模式后打印特定行数

我必须在输入文件中每次出现表达式“AAA”后打印 81 行。我该怎么办?

回答 6 投票 0

如何替换字符串中除第一次出现之外的所有模式

快速问题:我的模式是一个 svg 字符串,它看起来像 l 5 0 l 0 10 l -5 0 l 0 -10 要针对参考进行一些单元测试比较,我需要放弃除第一个 l 之外的所有内容,我知道我可以放弃...

回答 6 投票 0

如何在 PySpark 中使用正则表达式从 UDF 中获取最后一个特定字符?

我正在尝试使用正则表达式(regex)从 PySpark DataFrame 中提取最后一个字符,以便执行一些数据清理和解析为列。 目前,我正在使用 UDF (U...

回答 1 投票 0

Apache Nifi 表达式语言:查找与正则表达式匹配的部分内容

任务是找到表达式中与所选正则表达式匹配的部分,并将该部分放入新字段的值中。 例如,“描述”字段中的表达式: “拉蒂特...

回答 1 投票 0

正则表达式,如何提取两个单词之间的字符串

string text = "0.索引 - 1,名称 - mirlan,余额 - 300"; 我需要提取整数 1 作为索引,字符串“mirlan”作为名称,int 余额作为 300 我需要用正则表达式来做到这一点,常规

回答 1 投票 0

建议解决此问题的替代方法,或者修复如何使用正则表达式操作输入数据?

我正在研究一种解决方案来计算 input_data 中唯一 id 的数量并忽略重复项,无论连字符后的值如何不同,例如“7 / 8-2”和“7 / 8-...

回答 1 投票 0

Pandas contains 方法返回不应该匹配的行

我有一个数据框,我正在使用 str.contains 过滤它 df[df["series"].str.contains(".*(?i)d?max.*",regex=True)]["series"].value_counts() 结果包含...

回答 1 投票 0

正则表达式 - 匹配不按顺序的重复字符

有没有办法匹配不在序列中的重复字符? 假设我正在字符串中查找至少两个 6。 var 字符串 = "61236"; 我只能找到可以...

回答 4 投票 0

正则表达式:用点(.)匹配字符串?

我是一个十足的Reg-exp菜鸟,所以请耐心等待。试图用谷歌搜索这个,但还没有找到。 编写以...开头的正则表达式匹配文件的适当方法是什么?

回答 7 投票 0

PCRE2 命名组捕获阵列

我的 PCRE2 正则表达式引擎有问题。当命名组在文本中出现多次时,它仅捕获该组的最后一次出现。 例子: 正则表达式模式 \w+\s(?(\d...

回答 1 投票 0

如何在使用正则表达式时处理波兰语字符?

我的街道名称为 KRZYWOŃ ANIELI,那么我的正则表达式应该是什么来允许这种表达。目前我有一个简单的使用 /^[a-zA-Z ]+$/ 请指教。

回答 5 投票 0

ADF - 数据流表达式生成器清理/解析列

使用以下代码成功转换EPOCH时间戳后: toTimestamp(toLong(toString(已发布)),'yyyy-MM-dd') 我很难从这家公司中提取正确的信息...

回答 1 投票 0

正则表达式括号之间的匹配 (...)

我正在尝试从一条简单的线中抓取 2 件物品。 [标题](描述) 编辑:实际上一个想要显示的网址称为描述,因为我希望它显示而不是实际解析。 [三艺](...

回答 2 投票 0

从10-K开始——提取SIC、CIK,创建元数据表

我正在与 Edgar 的 10-K 合作。为了协助文件管理和数据分析,我想创建一个表,其中包含每个文件的路径、提交的公司的 CIK 编号(这是...

回答 2 投票 0

什么正则表达式可以允许分隔符,但前提是周围的组存在?

我需要设计一个正则表达式来匹配由分隔符分隔的 4 个部分(在本例中为:)。 4个部分必须是有序的,并且每个部分之间必须有分隔符,但是这些部分都是可选的...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.