我尝试使用出色的软件包dlookr
执行探索性数据分析(EDA)。我的结果变量是二元的。
raw_data[1:200, c(1:15, 599)] %>% eda_web_report(output_file = "temp.html", output_dir = here::here())
# processing file: eda_temp.Rmd
# |............................................ | 86% [group-numerical] Error in `tab[2, 4]`:
# ! subscript out of bounds
# Backtrace:
# 1. dlookr:::html_target_numerical(...)
# 3. reactable::reactable(...)
# 4. base::lapply(...)
# 5. reactable (local) FUN(X[[i]], ...)
# 6. base::lapply(...)
# 7. reactable (local) FUN(X[[i]], ...)
# 8. reactable:::callFunc(details, index, key)
# 10. dlookr (local) `<fn>`(6L)
#
# Quitting from lines 363-375 [group-numerical] (eda_temp.Rmd)
我注意到问题是输出变量(二进制是/否)采用数字格式(0/1)。所以,一个简单的
mutate
和 as.factor()
就是解决方案。