我有2个矩阵。 traf_id
代表两列交通信号灯的ID(如果红绿灯最靠近汽车,则它位于第一列)。第二个矩阵traf_state
表示交通灯的状态(1 =红色和2 =绿色)(同样,最近的光的状态放在第一列中)。
traf_id <- matrix(data = c(rep(12353,4), rep(12453,4), rep(12453,4), rep(12353,4)), nrow = 8, ncol = 2)
[,1] [,2]
[1,] 12353 12453
[2,] 12353 12453
[3,] 12353 12453
[4,] 12353 12453
[5,] 12453 12353
[6,] 12453 12353
[7,] 12453 12353
[8,] 12453 12353
traf_state <- matrix(data = c(rep(1,8), rep(2,8)), nrow = 8, ncol = 2)
[,1] [,2]
[1,] 1 2
[2,] 1 2
[3,] 1 2
[4,] 1 2
[5,] 1 2
[6,] 1 2
[7,] 1 2
[8,] 1 2
在上面的数据中,交通灯12353
在前4个时间帧(traf_state
等于1)最接近汽车,因此,放在第一列。从第5帧到第8帧,12453
是最接近的一个。
我想创建一个包含3列的数据框。第一个应该是时间帧列,另外两个应该包含给定时间范围内给定交通灯的交通状态:
foo <- data.frame(frames = 1:8, state_12353 = c(rep(1,4), rep(2,4)), state_12453 = c(rep(2,4), rep(1,4)))
> foo
frames state_12353 state_12453
1 1 1 2
2 2 1 2
3 3 1 2
4 4 1 2
5 5 2 1
6 6 2 1
7 7 2 1
8 8 2 1
请指导我在dplyr
中创建上述数据框的相关功能。
似乎你有代表时间框架的行,代表交通灯对汽车的相对位置的列;要将红绿灯id与其状态相匹配,您需要将原始数据收集到长格式,以便坐标(时间和位置)成为两个单独的列,然后您可以加入这些列:
# make the data frames
traf_id_df <- data.frame(traf_id, frames = 1:8)
traf_state_df <- data.frame(traf_state, frames = 1:8)
library(dplyr); library(tidyr)
inner_join(
gather(traf_id_df, Distance, Id, -frames),
gather(traf_state_df, Distance, State, -frames)
) %>%
select(-Distance) %>%
mutate(Id = paste0("state_", Id)) %>%
spread(Id, State)
# frames state_12353 state_12453
#1 1 1 2
#2 2 1 2
#3 3 1 2
#4 4 1 2
#5 5 2 1
#6 6 2 1
#7 7 2 1
#8 8 2 1
或者由于两个矩阵中的元素彼此对应,您可以按元素方式绑定两个矩阵,然后重新整形:
cbind(
seq_len(nrow(traf_id)),
as.vector(traf_id),
as.vector(traf_state)
) %>% as.data.frame() %>%
setNames(c('frames', 'id', 'state')) %>%
mutate(id = paste0('state_', id)) %>%
spread(id, state)
# frames state_12353 state_12453
#1 1 1 2
#2 2 1 2
#3 3 1 2
#4 4 1 2
#5 5 2 1
#6 6 2 1
#7 7 2 1
#8 8 2 1