我有一个数据框,其中的列称为“ msg”。
在“ msg”列中,所有行都是这样。
I ate an apple (id=1) and an orange (id=4) at Dec 30, 2019, 6:08:87 PM
我如何提取“在2019年12月30日下午6:08:87 Pm之前”作为细胞的所有内容?
我当前的代码如下,但我不确定如何填写拍子。
Test = df['msg'].str.extract(pat='...')
您可以在此处使用正向超前正则表达式:
Test = df['msg'].str.extract(pat='^.*(?=\bat [A-Za-z]{3} \d{2}, \d{4}, [\d:]+ (?:AM|PM)$)')