pyspark用正则表达式替换正则表达式

问题描述 投票:0回答:1

我试图用一个正则表达式替换正则表达式(在这种情况下是一个带数字的空格)

我有一个包含字符串列的Spark数据帧。我想用逗号替换正则表达式(空格加数字)而不丢失数字。我试过这两个没有运气:

df.select(“A”,f.regexp_replace(f.col(“A”),“\ s + [0-9]”,“,”)。alias(“被替换”))

df.select(“A”,f.regexp_replace(f.col(“A”),“\ s + [0-9]”,“\ s + [0-9],')。alias(”被替换“))

任何帮助表示赞赏。

pyspark
1个回答
0
投票

你需要的是另一个函数regex_extract

所以,你必须划分正则表达式并得到你需要的部分。它可能是这样的:

df.select("A", f.regexp_extract(f.col("A"), "(\s+)([0-9])", 2).alias("replaced"))
© www.soinside.com 2019 - 2024. All rights reserved.