Pandas:str提取字符串末尾以外的所有内容的文本

问题描述 投票:0回答:1

我有一个数据框,其中的列称为“ msg”。

在“ msg”列中,所有行都是这样。

I ate an apple (id=1) and an orange (id=4) at Dec 30, 2019, 6:08:87 PM

我如何提取“在2019年12月30日下午6:08:87 Pm之前”作为细胞的所有内容?

我当前的代码如下,但我不确定如何填写拍子。

Test = df['msg'].str.extract(pat='...')
python regex pandas dataframe extract
1个回答
0
投票

您可以在此处使用正向超前正则表达式:

Test = df['msg'].str.extract(pat='^.*(?=\bat [A-Za-z]{3} \d{2}, \d{4}, [\d:]+ (?:AM|PM)$)')
© www.soinside.com 2019 - 2024. All rights reserved.