我想仅在至少存在多个值的情况下计算具有缺失值的向量的均值。因此,例如,如果只有一个(或少于五个)值不丢失,我想返回NA,但如果我有至少两个(或超过五个)非缺失值,我想返回意思。
我怎么能用mean()
实现这个目标?
mean()
的标准行为是,如果至少有一个值丢失,则返回NA;如果至少有一个值不丢失,则返回均值(我想要介于两者之间):
x = c(1, 2, NA, NA)
mean(x) # returns NA if there is one (or more) value missing
[1] NA
mean(x, na.rm = T) # returns the mean of the existing values (if there is at least one)
[1] 1.5
理想情况下,我想要一个适用于tapply(..., FUN = mean)
场景的解决方案。
这是使用ifelse
function的一种方法:
x <- c(rep(NA_real_, 5), 1:4)
mean(x, na.rm = T)
[1] 2.5
ifelse(sum(!is.na(x)) > 5, mean(x, na.rm = T), NA_real_)
[1] NA