我试图从文档中的一个非常特殊的词列表中删除连字符,例如:。
afore-mention, base-line, start-up >> aforemention, baseline, startup。
我想为此写一个REGEX行,因为任务和模式总是一样的:从已知的词对中添加删除一个连字符。当然,我可以为每个词对单独编写REGEX操作,但这样做非常笨拙,而且耗费资源。
(afore)-(mention) >> $1$2
(base)-(line) >> $1$2
(start)-(up) >> $1$2
etc.
这似乎是一个更简单的方法。
(?:(afore)-(mention)|(base)-(line)|(start)-(up)) >> $1$2
问题是这样做会给每一个匹配提供一个新的回溯参考,而这是没有用的。我可以做两个列表,但这样我就会出现一些我不想要的奇怪的匹配,如果列表变长,这就成了一个问题,可能会出现随机匹配(afore-line >>aforeline,bas-up >>baseup,等等)。
(?:(afore|base|start)-(mentioned|line|up)) >> $1$2
有什么想法吗?先谢谢你