我目前有字符串,例如E-1082067D
,我想查询每行的简化版本。返回L(代替A-Z的字母),S(代表符号)和N(代数0-9)。我无法更新数据库或创建新表,因为我没有权限,只是想查询数据。
到目前为止,我已将我的字符串拆分为单个字符,现在想要替换拆分字符并将它们连接在一起以给出我的最终结果,例如代替E-1082067D
将是LSDDDDDDDL
。
任何有关如何清理以下内容的反馈,或者如果我以错误的方式解决这个问题,我们将不胜感激。
小号
elect site_name,natid, x, COUNT (x), substring(natid,1,1)as a,
substring(natid,2,1)as b,
substring(natid,3,1)as c,
substring(natid,4,1)as d,
substring(natid,5,1)as e,
substring(natid,6,1)as f,
substring(natid,7,1)as g,
substring(natid,8,1)as h,
substring(natid,9,1)as i,
substring(natid,10,1)as j,
substring(natid,11,1)as k,
substring(natid,12,1)as l,
substring(natid,13,1)as m
from (
select site_name, subject_id, natid,natidchk, length(natid)as x
from demog
order by x) as y
group by natid, site_name, x
order by site_name, x;
这可以通过使用多个正则表达式来实现:
with data (natid) as (
values
('E-1082067D'),
('X&42FOO567$BAR')
)
select natid,
regexp_replace(regexp_replace(regexp_replace(natid, '([A-Z])', 'L', 'ig'), '[0-9]', 'N', 'ig'), '[-&$]', 'S', 'ig')
from data;
首先所有出现的A-Z
都被L
取代,然后所有出现的0-9
都被替换为N
和-
,&
或$
被S
取代
以上回报:
natid | regexp_replace
---------------+---------------
E-1082067D | LSNNNNNNNL
X&42FOO567$BAR | LSNNLLLNNNSLLL