我正在尝试构建一个有效的正则回归,将具有以下约束的多行连接到单行。
阳性样本:
比赛 -> 我最喜欢的书如下: 一本很棒的书 scala.io 上的有效书籍 试卷
匹配行,直到每行的第一个字母为大写。 -> 我最喜欢的书如下: 一本很棒的书
负样本: 我最喜欢的书如下: 一本好书 又一句话
不匹配
我创建了以下正则表达式,但它匹配每一行,无论它是否以大写字母开头。
(^[A-Z].*:)\n(^[A-Z].+(?:\s+[a-zA-Z0-9,.\/ ]+){1,10})
如果上面的正则表达式与预期的行匹配,我将替换 ' ' 带有空格和逗号。