我想在总资产上创建一个变量的日志变量。我喜欢这个:
`HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))`
我收到错误消息:In log(HRSdata2$h1atotb) : NaNs produced
我的数据集显示我在记录时记录NA(NA),但是,为什么我得到NaN?他们更关心我。
还有人可以告诉我运行循环的代码或其他智能方法将日志应用到一堆列?目前这是我(我知道的很差)代码:
HRSdata2$h1logass <- (ifelse(HRSdata2$h1atotb > 0, log(HRSdata2$h1atotb), 0))
HRSdata2$h2logass <- (ifelse(HRSdata2$h2atotb > 0, log(HRSdata2$h2atotb), 0))
HRSdata2$h3logass <- (ifelse(HRSdata2$h3atotb > 0, log(HRSdata2$h3atotb), 0))
HRSdata2$h4logass <- (ifelse(HRSdata2$h4atotb > 0, log(HRSdata2$h4atotb), 0))
HRSdata2$h5logass <- (ifelse(HRSdata2$h5atotb > 0, log(HRSdata2$h5atotb), 0))
HRSdata2$h6logass <- (ifelse(HRSdata2$h6atotb > 0, log(HRSdata2$h6atotb), 0))
HRSdata2$h7logass <- (ifelse(HRSdata2$h7atotb > 0, log(HRSdata2$h7atotb), 0))
HRSdata2$h8logass <- (ifelse(HRSdata2$h8atotb > 0, log(HRSdata2$h8atotb), 0))
HRSdata2$h9logass <- (ifelse(HRSdata2$h9atotb > 0, log(HRSdata2$h9atotb), 0))
HRSdata2$h10logass <- (ifelse(HRSdata2$h10atotb > 0, log(HRSdata2$h10atotb), 0))
我基本上只需要学习如何循环变量名称谢谢。
当你做ifelse(x > 0, log(x), 0)
时,R计算log(x)
:
> x <- c(2, -1, 3)
> ifelse(x > 0, log(x), 0)
[1] 0.6931472 0.0000000 1.0986123
Warning message:
In log(x) : NaNs produced
但是在结果中你没有得到NaN
,你得到0
对应于x <= 0
的值。
这个ifelse
声明相当于
ifelse(c(TRUE, FALSE, TRUE), c(log(2), log(-1), log(3)), c(0,0,0))
R不会丢弃第一个参数的值为FALSE
的第二个参数的值的计算。
我个人对ifelse
感到厌恶,而是倾向于使用两行代码来填写默认值,然后有条件地应用替代品。
要遍历所有列,您可以使用以下代码(由于没有数据,我没有删除它)
for(i in 1:10){
HRSdata2[,paste0('h',i,'logass')] <- 0
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)
HRSdata2[w,paste0('h',i,'logass')] <- HRSdata2[w,paste0('h',i,'atotb')]
}
此代码将为NA值输出零,如果不需要,则应替换:
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0)
有:
w <- which(HRSdata2[,paste0('h',i,'atotb')] > 0 | is.na( HRSdata2[,paste0('h',i,'atotb')] ) )