pandas.Series.str.Replace返回Nan

问题描述 投票:0回答:1

我有一些文字存储在pandas.series中。例如:

df.loc[496]

'therapist and friend died in ~2006 Parental/Caregiver obligations:\n'

我需要用全约日期替换文本中的数字,所以我写了

df.str.replace(
    pat=r'(?:[^/])(\d{4}\b)', 
    repl= lambda m: ''.join('Jan/1/', m.groups()[0]), 
    regex=True
)

,但输出为NAN;尽管我尝试使用Findall测试正则表达式,但没有问题:

df.str.findall(r'(?:[^/])(\d{4}\b)')

496    [2006]

我不明白问题是什么。提出的大多数问题是串联类型为数字而不是str的情况。但是我的情况是不同的数据类型显然是str。尽管如此,我还是尝试了

.astype(str)
,但仍然有相同的结果nan。

python pandas regex python-re
1个回答
2
投票
可能的解决方案:

df = pd.Series({496: 'therapist and friend died in ~2006 Parental/Caregiver obligations:\n'}) df.replace(r'~?(\d{4})\b', r'Jan 1, \1', regex=True)
输出:

496 therapist and friend died in Jan 1, 2006 Paren... dtype: object
    
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.