正则表达式 - 按期间分割（St.除外）

问题描述投票：-1回答：1

我正在Python中逐一阅读这些行。如果它们包含句子的结尾，我必须将它们分开。我正在使用re.split功能：

words= re.split(r'[.!?]', line)

这很有效，除非我遇到诸如'St.'之类的缩写。有没有办法分开'。！？'但当它被用作'圣'时忽略？

1个回答

0
投票

您可以尝试使用负面的lookbehind：

words = re.split(r'(?<!St)[.!?]', line)

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.