我正在尝试将this long JS regex转换为C#。
下面的JS代码给出了从["","常","","に","","最新","、","最高"...]
开始的数组中的29个项目
var keywords = /(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g;
var source = '常に最新、最高のモバイル。Androidを開発した同じチームから。';
var result = source.split(keywords);
但下面的C#代码给出了string[]
中的非拆分单项。
var keywords = @"/(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g";
var source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
var result = Regex.Split(source, keywords);
Stack Overflow中的许多问题仅涵盖相对简单的表达式,因此我无法找到错误。
我错过了什么?
您的RegEx错误,您不应该以'/'
或'/g'
开头和结尾您在构造函数中指定了一个字符串,而不是JavaScript Regex(带有'/ /'语法。)。这是一个Javascript语法。
实际上,当您使用这样的字符串构造函数时,同样适用于JavaScript:
var regex = new RegExp('//');
//这将匹配2个斜杠
这是一个C#示例代码
string keywords = @"(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)";
string source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
string [] res = Regex.Split(source, keywords);
string single = "";
foreach ( string str in res )
single += "'" + str + "',";
Console.WriteLine("{0}", single);