如何使用 Regex.Split 分割字符串并保留所有分隔符?

问题描述 投票:0回答:2

如何使用 Regex.Split 拆分字符串并保留所有分隔符?

我有一个字符串:“substring1 delimeter1 substring2”,其中 delimeter+substring2 是地址的一部分。

我还有 2 个及更多分隔符:delim1,delim2,其含义相同;

我想得到这样的字符串数组:

arr[0]="subsctring1";
arr[1]="delim1 subsctring2";

或者,

arr[1]="delim2 subsctring2;

我有一个模式:

addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);

但是效果不太好。

你能帮我创建一个有效的模式吗?

c# regex string
2个回答
3
投票

您需要一个仅具有前瞻功能的模式:

\s+(?=delim1|delim2)

\s+
将匹配 1 个或多个空格(因为您的字符串包含空格)。如果没有空格,请使用
\s*
(但随后您需要从结果中删除空条目)。请参阅正则表达式演示。如果这些分隔符必须是整个单词,请使用
\b
单词边界:
\s+(?=\b(?:delim1|delim2)\b)

在 C# 中:

addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));

如果分隔符可以包含特殊的正则表达式元字符,您将需要在

Regex.Escape
列表上运行
delimiters

A C# 演示:

var inputText = "substring1 delim1 substring2 delim2 substr3";
var  delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText, 
        string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));

2
投票

我认为你需要使用前瞻,而不是后瞻,才能使其发挥作用(但还没有尝试过)。

另外,你必须小心分隔符;它们必须被转义才能作为正则表达式中的模式正常工作。

试试这个:

addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);
© www.soinside.com 2019 - 2024. All rights reserved.