查找里面有重复字母的字符串

Question

有人可以帮我完成这个小任务吗？我需要的是一个存储过程，它可以从表“a”中找到字符串中的重复字母（在一行中），之后创建一个新表“b”，其中只包含具有重复字母的字符串的id。

像这样的东西：

表A.

ID Name   
1  Matt
2  Daave
3  Toom
4  Mike
5  Eddie

从那张桌子我可以看到Daave，Toom，Eddie连续重复的字母，我想创建一个新表并列出他们的ID唯一。就像是：

表B.

只有2,3,5，因为这是其名称中包含重复字母的字符串的ID。

我希望这是可以理解的，并且非常感谢任何帮助。

Answer 1

在使用存储过程的答案中，您有2个错误，一个是列名和LIKE子句之间缺少空格，第二个是缺少搜索参数周围的单引号。

我首先创建用户定义的标量函数，如果字符串包含重复的字母，则返回1：

EDITED

CREATE FUNCTION FindDuplicateLetters
(
    @String NVARCHAR(50)
)
RETURNS BIT
AS
BEGIN

    DECLARE @Result BIT = 0 
    DECLARE @Counter INT = 1

    WHILE (@Counter <= LEN(@String) - 1) 
    BEGIN


    IF(ASCII((SELECT SUBSTRING(@String, @Counter, 1))) = ASCII((SELECT SUBSTRING(@String, @Counter + 1, 1))))
        BEGIN
             SET @Result = 1
             BREAK
        END


        SET @Counter = @Counter + 1 
    END

    RETURN @Result

END
GO

创建函数后，只需从简单的SELECT查询中调用它，如下所示：

SELECT 
    * 
FROM
    (SELECT 
        *, 
        dbo.FindDuplicateLetters(ColumnName) AS Duplicates
    FROM TableName) AS a
WHERE a.Duplicates = 1

使用此组合，您将获得具有重复字母的行。

Answer 2

在任何版本的SQL中，您都可以使用强力方法执行此操作：

select *
from t
where t.name like '%aa%' or
      t.name like '%bb%' or
      . . .
      t.name like '%zz%'

如果您具有区分大小写的排序规则，请使用：

where lower(t.name) like '%aa%' or
      . . .

Answer 3

虽然这是一个旧帖子，但是值得发布一个比蛮力方法更快或者使用标量udf（通常会降低性能）的解决方案。使用NGrams8K这很简单。

--sample data
declare @table table (id int identity primary key, [name] varchar(20));
insert @table([name]) values ('Mattaa'),('Daave'),('Toom'),('Mike'),('Eddie');

-- solution #1
select id
from @table
cross apply dbo.NGrams8k([name],1)
where charindex(replicate(token,2), [name]) > 0
group by id;

-- solution #2 (SQL 2012+ solution using LAG)
select id
from
(
  select id, token, prevToken = lag(token,1) over (partition by id order by position)
  from @table
  cross apply dbo.NGrams8k([name],1)
) prep
where token = prevToken
group by id; -- optional id you want to remove possible duplicates.

Answer 4

这是一种方式。

首先创建一个数字表

CREATE TABLE dbo.Numbers
  (
     number INT PRIMARY KEY
  );

INSERT INTO dbo.Numbers
SELECT number
FROM   master..spt_values
WHERE  type = 'P'
       AND number > 0;

然后使用它就可以使用

SELECT *
FROM   TableA
WHERE  EXISTS (SELECT *
               FROM   dbo.Numbers
               WHERE  number < LEN(Name)
                      AND SUBSTRING(Name, number, 1) = SUBSTRING(Name, number + 1, 1))

查找里面有重复字母的字符串

问题描述投票：2回答：4

4个回答

最新问题

查找里面有重复字母的字符串

问题描述 投票：2回答：4

4个回答

最新问题

问题描述投票：2回答：4