我有一个数据集,我使用cbindX
包中的gdata
函数通过列绑定创建。此函数允许我绑定具有不同行数的列。因此,当特定列中没有值时,会引入NA
。现在,我想计算每列的标准偏差。我试过用
sapply(dataset,sd)
这将返回具有值的所有行的列的标准偏差,并为具有较少行的列返回NA
。我尝试使用na.rm
函数的sd
参数:
sapply(dataset,sd(na.rm=T))
并收到错误消息
Error in is.data.frame(x) : argument "x" is missing, with no default
例如:
firstcol <- matrix(c(1:150),ncol=1)
secondcol <- matrix(c(1:300),ncol=1)
thirdcol <- matrix(c(1:450),ncol=1)
fourthcol <- matrix(c(1:600),ncol=1)
fifthcol <- matrix(c(1:30),ncol=1)
sixthcol <- matrix(c(1:30),ncol=1)
seventhcol <- matrix(c(1:30),ncol=1)
library(gdata)
allcolscomb <- data.frame(cbindX (firstcol,secondcol,thirdcol,fourthcol,fifthcol,sixthcol,seventhcol))
names(allcolscomb) <- c("1stcol","2ndcol","3rdcol","4thcol","5thcol","6thcol","7thcol")
sapply(allcolscomb,sd)
sapply(allcolscomb,sd(na.rm=T))
如何使用sapply
函数计算标准偏差?
你应该阅读?sapply
手册。下面带有一些额外参数的sapply示例:
sapply(allcolscomb, sd, na.rm=TRUE)
sapply(allcolscomb, function(x) sd(x, na.rm=TRUE))
试试这个。
sapply(allcolscomb,sd, na.rm = TRUE)
在apply系列函数中,语法是(data,fun,...)。这三个点是“省略号”,它们用于存放传递给apply函数的函数的参数。