如何在R中使用小计(如在MS Excel数据透视表中)获得Pivots?
我正在使用来自dcast
包的reshape2
在R中创建枢轴。我还使用rowSums
和colSums
工作。我承认我不理解dcast
参数集中的复杂性。我只知道如何创建枢轴,帮助文件正在我的头上。如果有人可以使用dcast
解决这个问题(我怀疑它可以做到这一切),并解释解决方案所需的参数,将会非常有帮助。
我正在使用此代码(C2有两个因素,X1和X2):
PIV <- dcast(DF, C1~C2, value.var="C3", sum)
我没有得到所有这些边际,子集,填充或丢弃的东西。帮助文件似乎过于迟钝,我也没有在互联网上获得太多帮助。
示例Pivot(没有小计,T是总计):
C1 X1 X2 T
a 12 1 13
a 14 2 16
b 16 3 19
b 11 4 15
b 8 5 13
T 61 15 76
样本预期枢轴(小计t,T为总计)
C1 X1 X2 T
a 12 1 13
a 14 2 16
ta 26 3 29
b 16 3 19
b 11 4 15
b 8 5 13
tb 35 12 47
T 61 15 76
假设你在没有任何总数的情况下开始,有这样的事情:
mydf <- structure(list(C1 = c("a", "a", "b", "b", "b"), X1 = c(12L, 14L,
16L, 11L, 8L), X2 = 1:5), .Names = c("C1", "X1", "X2"), row.names = c(NA,
5L), class = "data.frame")
mydf
## C1 X1 X2
## 1 a 12 1
## 2 a 14 2
## 3 b 16 3
## 4 b 11 4
## 5 b 8 5
然后你必须使用margins
参数为dcast
获得你想要的输出。
library(reshape2)
mydfl <- melt(mydf)
mydfl$ind <- with(mydfl, ave(C1, C1, variable, FUN = seq_along))
dcast(mydfl, C1 + ind ~ variable, sum,
margins = c("C1", "ind", "variable"))
# C1 ind X1 X2 (all)
# 1 a 1 12 1 13
# 2 a 2 14 2 16
# 3 a (all) 26 3 29
# 4 b 1 16 3 19
# 5 b 2 11 4 15
# 6 b 3 8 5 13
# 7 b (all) 35 12 47
# 8 (all) (all) 61 15 76
“边距”参数是用于获取小计的内容。在这里,我们根据“C1”(总计)和“ind”变量(小计)进行小计,我们还添加行总数(使用“变量”)。
也就是说,我不确定我是否会推荐这个,因为你在同一个表格中混合了数据和分析。