查找里面有重复字母的字符串

问题描述 投票:2回答:4

有人可以帮我完成这个小任务吗?我需要的是一个存储过程,它可以从表“a”中找到字符串中的重复字母(在一行中),之后创建一个新表“b”,其中只包含具有重复字母的字符串的id。

像这样的东西:

表A.

ID Name   
1  Matt
2  Daave
3  Toom
4  Mike
5  Eddie

从那张桌子我可以看到DaaveToomEddie连续重复的字母,我想创建一个新表并列出他们的ID唯一。就像是:

表B.

ID     
2
3
5

只有2,3,5,因为这是其名称中包含重复字母的字符串的ID。

我希望这是可以理解的,并且非常感谢任何帮助。

sql sql-server tsql duplicates letters
4个回答
4
投票

在使用存储过程的答案中,您有2个错误,一个是列名和LIKE子句之间缺少空格,第二个是缺少搜索参数周围的单引号。

我首先创建用户定义的标量函数,如果字符串包含重复的字母,则返回1:

EDITED

CREATE FUNCTION FindDuplicateLetters
(
    @String NVARCHAR(50)
)
RETURNS BIT
AS
BEGIN

    DECLARE @Result BIT = 0 
    DECLARE @Counter INT = 1

    WHILE (@Counter <= LEN(@String) - 1) 
    BEGIN


    IF(ASCII((SELECT SUBSTRING(@String, @Counter, 1))) = ASCII((SELECT SUBSTRING(@String, @Counter + 1, 1))))
        BEGIN
             SET @Result = 1
             BREAK
        END


        SET @Counter = @Counter + 1 
    END

    RETURN @Result

END
GO

创建函数后,只需从简单的SELECT查询中调用它,如下所示:

SELECT 
    * 
FROM
    (SELECT 
        *, 
        dbo.FindDuplicateLetters(ColumnName) AS Duplicates
    FROM TableName) AS a
WHERE a.Duplicates = 1

使用此组合,您将获得具有重复字母的行。


3
投票

在任何版本的SQL中,您都可以使用强力方法执行此操作:

select *
from t
where t.name like '%aa%' or
      t.name like '%bb%' or
      . . .
      t.name like '%zz%'

如果您具有区分大小写的排序规则,请使用:

where lower(t.name) like '%aa%' or
      . . .

1
投票

虽然这是一个旧帖子,但是值得发布一个比蛮力方法更快或者使用标量udf(通常会降低性能)的解决方案。使用NGrams8K这很简单。

--sample data
declare @table table (id int identity primary key, [name] varchar(20));
insert @table([name]) values ('Mattaa'),('Daave'),('Toom'),('Mike'),('Eddie');

-- solution #1
select id
from @table
cross apply dbo.NGrams8k([name],1)
where charindex(replicate(token,2), [name]) > 0
group by id;

-- solution #2 (SQL 2012+ solution using LAG)
select id
from
(
  select id, token, prevToken = lag(token,1) over (partition by id order by position)
  from @table
  cross apply dbo.NGrams8k([name],1)
) prep
where token = prevToken
group by id; -- optional id you want to remove possible duplicates. 

1
投票

这是一种方式。

首先创建一个数字表

CREATE TABLE dbo.Numbers
  (
     number INT PRIMARY KEY
  );

INSERT INTO dbo.Numbers
SELECT number
FROM   master..spt_values
WHERE  type = 'P'
       AND number > 0;

然后使用它就可以使用

SELECT *
FROM   TableA
WHERE  EXISTS (SELECT *
               FROM   dbo.Numbers
               WHERE  number < LEN(Name)
                      AND SUBSTRING(Name, number, 1) = SUBSTRING(Name, number + 1, 1)) 
© www.soinside.com 2019 - 2024. All rights reserved.