我有一些文字存储在pandas.series中。例如:
df.loc[496]
'therapist and friend died in ~2006 Parental/Caregiver obligations:\n'
我需要用全约日期替换文本中的数字,所以我写了
df.str.replace(
pat=r'(?:[^/])(\d{4}\b)',
repl= lambda m: ''.join('Jan/1/', m.groups()[0]),
regex=True
)
,但输出为NAN;尽管我尝试使用Findall测试正则表达式,但没有问题:
df.str.findall(r'(?:[^/])(\d{4}\b)')
496 [2006]
我不明白问题是什么。提出的大多数问题是串联类型为数字而不是str的情况。但是我的情况是不同的数据类型显然是str。尽管如此,我还是尝试了
.astype(str)
,但仍然有相同的结果nan。
df = pd.Series({496: 'therapist and friend died in ~2006 Parental/Caregiver obligations:\n'})
df.replace(r'~?(\d{4})\b', r'Jan 1, \1', regex=True)
输出:
496 therapist and friend died in Jan 1, 2006 Paren...
dtype: object