允许在 postgreSQL 正则表达式文本中使用括号

问题描述 投票:0回答:1

这些句子有效

SELECT (regexp_matches('Euroschinus Hoff+300'::text, E'(Euroschinus Hoff[\+])([0- 9]+)'::text)::text[])[1]::text as counter 
select array_scientificname from simple_cal where array_scientificname ~ 'Semecarpus'

但是,如果有一些括号,不管文本中的哪个位置,两者都不起作用

SELECT (regexp_matches('Euroschinus (testing) Hoff+300'::text, E'(Euroschinus (testing)  Hoff[\+])([0-9]+)'::text)::text[])[1]::text as counter 
select array_scientificname from simple_cal where array_scientificname ~  'Semecarpus(test)'

我只想得到文字。 () 没有定义的模式,可以出现在文本的任何位置。

我注意到在括号之前使用 \ 可以达到目的(见下文),但这根本不实用。我想我应该在字符串中包含 () 的某个地方......

SELECT (regexp_matches('Euroschinus (testing) Hoff+300'::text, E'(Euroschinus jaffrei \\(testing\\) Hoff[\+])([0-9]+)'::text)::text[])[1]::text as counter
sql regex postgresql
1个回答
3
投票

这不会返回任何内容:

SELECT (regexp_matches(
         'Euroschinus (testing) Hoff+300'::text
     , E'(Euroschinus jaffrei \\(testing\\) Hoff[\\+])([0-9]+)')::text[])[1]::text;

从模式中删除字符串

jaffrei
后,这将是:

SELECT (regexp_matches(
         'Euroschinus (testing) Hoff+300'::text
     , E'(Euroschinus \\(testing\\) Hoff[\\+])([0-9]+)')::text[]);[1]::text

简化正则表达式,放弃无意义的字符类:

SELECT (regexp_matches(
         'Euroschinus (testing) Hoff+300'::text
     , E'(Euroschinus \\(testing\\) Hoff\\+)([0-9]+)')::text[])[1]::text;

如果您对必须添加反斜杠感到困扰,请尝试设置

standard_conforming_strings
(自 PostgreSQL 9.1 起的默认设置)并使用纯字符串而不是 Posix 转义序列:

SELECT (regexp_matches(
         'Euroschinus (testing) Hoff+300'::text
     , '(Euroschinus \(testing\) Hoff\+)([0-9]+)')::text[])[1]::text;

但是如果您只对第一次点击感兴趣,那么您宁愿使用

substring()
来开始。捕获括号选择您想要的字符串:

SELECT substring('Euroschinus (testing) Hoff+300'
              , '(Euroschinus \(testing\) Hoff\+)[0-9]+');

最后,如果您对字符串

()
中仅存在
(??)
感到困扰,请删除它们:

SELECT substring(translate('Euroschinus (testing) Hoff+300', '()', '')
                        , '(Euroschinus testing Hoff\+)[0-9]+');
© www.soinside.com 2019 - 2024. All rights reserved.