在R中将行扩展为多个列

Question

我正在尝试创建一个数据透视表，并遇到一些问题，以获得输出。我是包不可知论者，我尝试过reshape2，tidry和dplyr并且没有任何工作。

到目前为止我的尝试都有错误，我还设法收集数据，将Fill和Target删除为一个名为“Type”的新变量，值为“Seats ......但这似乎没有帮助。

mynewdf = gather(mydf,Type,Seats,c("Fill","Target"))

我认为接近工作的代码.....

t=dcast(mydf, Date + Type + Month ~ Seats, length, drop=FALSE)

我目前的数据结构如下：

Date Month Fill Target Code
1234  Jan  14    15    13B
1234  Feb  12    14    13B
.................
1235  Oct  13    16    13F

永远不应该有任何重复的日期/月/代码，我最想显示的是填充和目标（最终做一些计算字段，但我稍后会越过那个桥）。

我希望输出为：

        Jan             Feb        .......   Oct .....    
Date Fill  Target  Fill  Target    ....... Fill Target.... MOS
1234  14    15     12     14       ....................... 13B
1235  ......................................13   16  ..... 13F

我尝试按月分组，然后填充，然后是月和目标，但没有运气。

Answer 1

答案比我想要的更冗长，但这应该给你一个开始。

首先输入您显示的数据框：

library(dplyr); library(tidyr)

mydf <- data.frame(Date = c(1234, 1234, 1235),
                   Month = c('Jan', 'Feb', 'Oct'),
                   Fill = c(14, 12, 13),
                   Target = c(15, 14, 16),
                   Code = c('13B', '13B', '13F'))

然后用tidyr::unite()开始数据争论：

> newdf <- mydf %>% 
+     tidyr::unite(Fill_Target, Fill, Target, sep='_')
> newdf
  Date Month Fill_Target Code
1 1234   Jan       14_15  13B
2 1234   Feb       12_14  13B
3 1235   Oct       13_16  13F

因此，您将Fill和Target变量组合到一个列中。这样做，你可以使用tidyr::spread：

> newdf <- newdf %>% tidyr::spread(Month, Fill_Target)
> newdf
  Date Code   Feb   Jan   Oct
1 1234  13B 12_14 14_15  <NA>
2 1235  13F  <NA>  <NA> 13_16

那么在这里你有Date，Code，然后是你的Month，然后是Fill_Target值。然后使用tidyr::separate()将这些列分成单独的列：

> newdf <- newdf %>% 
+     tidyr::separate(Jan, into = c('Jan_Fill', 'Jan_Target')) %>% 
+     tidyr::separate(Feb, into = c('Feb_Fill', 'Feb_Target')) %>% 
+     tidyr::separate(Oct, into = c('Oct_Fill', 'Oct_Target'))
> newdf
  Date Code Feb_Fill Feb_Target Jan_Fill Jan_Target Oct_Fill Oct_Target
1 1234  13B       12         14       14         15     <NA>       <NA>
2 1235  13F     <NA>       <NA>     <NA>       <NA>       13         16

然后你可以使用dplyr::select()重新排序列

> newdf %>% 
+   select(Date, Jan_Fill, Jan_Target, Feb_Fill, Feb_Target, Oct_Fill, Oct_Target, 
+          Code)
  Date Jan_Fill Jan_Target Feb_Fill Feb_Target Oct_Fill Oct_Target Code
1 1234       14         15       12         14     <NA>       <NA>  13B
2 1235     <NA>       <NA>     <NA>       <NA>       13         16  13F

现在，我不喜欢这个答案，因为它有点冗长，特别是当你认为你将有12个月时。但是你可能更容易/更好地在你的代码中有点冗长和深思熟虑，而不是搞乱quasiquotations并试图以更好的方式分离和选择月份。

另外，我注意到只有一行“标题”而不是你的两行。不幸的是，如果你想要第二个标题行，你将不得不使用Python Pandas; R不支持这一点。

在R中将行扩展为多个列

问题描述投票：0回答：1

1个回答

最新问题

在R中将行扩展为多个列

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1