列中的每个更改都会增加1

Question

假设我有以下数据框架

set.seed(123)
df <- data.frame(var1=(runif(10)>0.5)*1)

var1可以有任何类型/数量的级别，而不是特定的0和1

我想创建一个var2，每次var1更改时增量为1而不使用for loop

这种情况下的预期结果是：

data.frame(var1=(runif(10)>0.5)*1, var2=c(1, 2, 3, 4, 4, 5, 6, 6, 6, 7))

var1 var2
   0    1
   1    2
   0    3
   1    4
   1    4
   0    5
   1    6
   1    6
   1    6
   0    7

数据框的另一个选择可能是：

df <- data.frame(var1=c("a", "a", "1", "0", "b", "b", "b", "c", "1", "1"))

在这种情况下，结果应该是：

Answer 1

以弗里克先生为基础回答：

df$var2 <- cumsum(c(0,as.numeric(diff(df$var1))!=0))

但如果您不想使用diff，您仍然可以使用：

df$var2 <- c(0,cumsum(as.numeric(with(df,var1[1:(length(var1)-1)] != var1[2:length(var1)]))))

它从0开始，而不是1，但我确定如果你愿意，你会看到如何改变它。

Answer 2

如何使用diff()和cumsum()。例如

df$var2 <- cumsum(c(1,diff(df$var1)!=0))

Answer 3

这些看起来像一个游程编码（rle）

x = c("a", "a", "1", "0", "b", "b", "b", "c", "1", "1")
r = rle(x)

同

> rle(x)
Run Length Encoding
  lengths: int [1:6] 2 1 1 3 1 2
  values : chr [1:6] "a" "1" "0" "b" "c" "1"

这表示第一个值（“a”）连续出现2次，然后“1”出现一次，等等。你要追求的是沿着'长度'创建一个序列，并复制序列中的每个元素。元素出现的次数，所以

> rep(seq_along(r$lengths), r$lengths)
 [1] 1 1 2 3 4 4 4 5 6 6

其他答案是半欺骗性的，因为它们依赖于列是因子（）;当列实际上是一个字符（）时它们会失败。

> diff(x)
Error in r[i1] - r[-length(r):-(length(r) - lag + 1L)] : 
  non-numeric argument to binary operator

解决方法是将字符映射到整数，沿着线条

> diff(match(x, x))
[1]  0  2  1  1  0  0  3 -5  0

嗯，但是我说我发现rle不适合因素！

> f = factor(x)
> rle(f)
Error in rle(factor(x)) : 'x' must be a vector of an atomic type
> rle(as.vector(f))
Run Length Encoding
  lengths: int [1:6] 2 1 1 3 1 2
  values : chr [1:6] "a" "1" "0" "b" "c" "1"

Answer 4

这是使用inverse.rle()的基本R的另一个解决方案：

df <- data.frame(var1=c("a", "a", "1", "0", "b", "b", "b", "c", "1", "1"))
r <- rle(as.character(df$var1))
r$values <- seq_along(r$values)
df$var2 <- inverse.rle(r)

精简版：

df$var2 <- with(rle(as.character(df$var1)), rep(seq_along(values), lengths))

这是data.table的解决方案：

library("data.table")
dt <- data.table(var1=c("a", "a", "1", "0", "b", "b", "b", "c", "1", "1"))
dt[, var2:=rleid(var1)]

列中的每个更改都会增加1

问题描述投票：6回答：4

4个回答

最新问题

列中的每个更改都会增加1

问题描述 投票：6回答：4

4个回答

最新问题

问题描述投票：6回答：4