通过正斜杠或什么都不拆分字符串

问题描述 投票:7回答:3

我想拆分这个向量

c("CC", "C/C")

[[1]]
[1] "C" "C"

[[2]]
[1] "C" "C"

我的最终数据应如下所示:

c("C_C", "C_C")

因此,我需要一些regex,但没有找到如何解决“非空间”部分:

strsplit(c("CC", "C/C"),"|/")
r regex split
3个回答
8
投票

您可以使用sub(或gsub,如果它在您的字符串中出现多次)直接替换任何内容或正斜杠与下划线(捕获一个字符周围):

sub("(\\w)(|/)(\\w)", "\\1_\\3", c("CC", "C/C"))
#[1] "C_C" "C_C"

5
投票

我们可以在每个字符处拆分字符串,省略“/”和paste它们在一起。

sapply(strsplit(x, ""), function(v) paste0(v[v!= "/"], collapse = "_"))

#[1] "C_C" "C_C"

数据

x <- c("CC", "C/C")

5
投票

我们可以用

lapply(strsplit(v1, "/|"), function(x) x[nzchar(x)])

或者使用正则表达式的外观

strsplit(v1, "(?<=[^/])(/|)", perl = TRUE)
#[[1]]
#[1] "C" "C"

#[[2]]
#[1] "C" "C"

如果最终输出应该是矢量,那么

gsub("(?<=[^/])(/|)(?=[^/])", "_", v1, perl = TRUE)
#[1] "C_C" "C_C"
© www.soinside.com 2019 - 2024. All rights reserved.