有人建议,R-package函数内部的函数调用最好使用标准评估(see here),尤其要避免使用utils::globalVariables
。
如果我使用dplyr包进行非标准评估,那么对于以下代码片段的标准评估的“转换”是什么 - 特别是对于table
-command?
grp
和dep
是数据框mydf
的数值,而x
是一个因子。
非标准评估:
pvals <- mydf %>%
dplyr::group_by(grp) %>%
dplyr::summarise(N = n(),
p = suppressWarnings(stats::chisq.test(table(x, dep))$p.value))
标准评估?
pvals <- mydf %>%
dplyr::group_by_("grp") %>%
dplyr::summarise_(N = n(),
p = suppressWarnings(stats::chisq.test(table("x", "dep"))$p.value))
而且,与ggplot
函数调用怎么样? ggplot
是否有标准评估支持?
编辑:添加了可重复的示例。
library(dplyr)
data(ChickWeight)
ChickWeight %>%
dplyr::group_by(Diet) %>%
dplyr::summarise(N = n(),
p = suppressWarnings(stats::chisq.test(table(weight, Time))$p.value))
如果你不想使用dplyr,我会忽略codetools :: checkUsagePackage()的误报。
您可以尝试永远不要在函数中对变量名进行硬编码,而是使用rlang
quasiquotation。
从您的示例中,在函数上下文中,我会写:
#' Chisq table
#' @importFrom rlang enquo !!
#' @importFrom magrittr %>%
#'
#' @param data Dataset
#' @param x,y,group bare variable names
#' @export
chisq_table <- function(data, x, y, group){
x <- enquo(x)
y <- enquo(y)
group <- enquo(group)
data %>%
dplyr::group_by(!!group) %>%
dplyr::summarise(
N = dplyr::n(),
p = suppressWarnings(stats::chisq.test(table(!!x, !!y))$p.value)
)
}
data(ChickWeight)
chisq_table(data = ChickWeight, x = weight, y = Time, group = Diet)
## # A tibble: 4 x 3
## Diet N p
## <fct> <int> <dbl>
## 1 1 220 4.42e-16
## 2 2 120 3.76e- 7
## 3 3 120 4.74e- 6
## 4 4 118 1.33e- 5
检查包时不会触发注释,如果数据集中的列名发生更改,则可以更轻松地维护函数。