将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
如何按单列分组并从多行和多列创建Python样式的列表字符串
我想通过mcode对数据进行分组,并为每个组创建两种不同类型的行。 以下是示例数据。 需要 Cat1 Cat2 Cat3 mcode 密钥 pcode 1 C1 C2 C31 B3100 真 P001 P...
我有一个由调查现场创建的数据集,他们为一些标签引入了大写撇号。 当我使用 Haven 包导入它时,那些大写撇号仍然保留。 我...
我目前正在使用 devtools 共同开发一个 R 包。我们使用 tidyverse %>% 以及我们的相关 purrr 和 dplyr 包 功能。 我们的功能之一如下(为班级编辑...
我试图更好地理解整洁的评估和 rlang 的使用,但有一个具体的用例我无法弄清楚。假设我想运行一个线性混合模型并保存一个预输出的输出...
我想总结一下每个物种符合一定条件的数量,以便进一步分析。 这是数据的示例 df <- data.frame(Species = c("BRK","BRK&quo...
dplyr::mutate 函数可以通过该列的索引修改该列的值吗?
例如: df = data.frame(A=c(1,2), B=c(3,4)) df %>% group_by(A) %>% 变异(.[[2]] = .[[2]] + 1) 该代码将不会运行。 代码: df %>% group_by(A) %>% 变异(B = .[[2]]+1) 可以...
我有一个 R 数据框,其中包含一年的年份、增长率和总计。我想通过使用 Growth_rate 进行折扣来填充缺失值,该增长率随着几年后的增加和之前几年的减少而增加。 ...
我有一个数据集,我正在尝试测试预注册课程的效率。我有入学日期、考试日期、科目和结果。学生被分为 第 1 组 - 30 天前
我有一个数据框,其中包含多个位置的每日分类值。我正在尝试创建一个新的数据框,对每个分类 v 的连续天和独立天进行分组...
我正在尝试从 Excel 复制以下输出。 使用直方图而不是饼图,并使用两个以上的后续直方图深入研究数据。理想的答案是这样的:
为什么将 eval(substitute(x,...)) 传递到 group_by() 会产生列名为“eval(substitute(x,...))”的 tibble?
在函数中传递带引号的变量作为参数时,我使用 eval() 和 Replace(x, list(x = as.name(x))) 的组合。一般来说我没有遇到任何问题,但我只是在使用时遇到了一个...
我可以应用哪个 dplyr 的 *_join 函数来不返回 NA?
我正在尝试将两个不同的数据帧合并在一起,以便第二个数据帧中的预测变量的值现在附加到第一个数据中的平均变量的值...
我有一个如下所示的数据框: 例子 <- data.frame( date = as.Date(c('2023-02-12', '2023-02-13', '2023-02-14', '2023-02-12', '2023-02-13', '2023-02-14', '2023...
我在 R 中有一个数据框,经过一些数据转换、计算和绘图后: 图书馆(tidyverse) 库(ggstats) 图书馆(拼凑而成) 图书馆(小标题) 图书馆(tidyverse) 库(ggplot2)
我正在尝试使用 R 中的 lm() 计算分组数据集中多个度量的斜率。但是,某些组对于某些度量具有所有 NA 值,这会导致以下错误: 错误...
我正在尝试创建一个新列,该列将名称中包含特定字符串的特定列集的所有值与分号分隔符连接起来。我在 dplyr 工作,所以...
我想创建数据框的另一列,根据顺序将第一列中的每个成员分组。 这是一个可重现的演示: df1=c("亚历克斯","23","ID#:123","约翰","26","ID#:...
这个问题与这个问题类似,但这种情况的不同之处在于按行抑制数据。 通过将每行中任何小于 6 的值替换为 -1 ...
众所周知,dplyr 的功能相当高效。然而,我发现自己处于这样一种情况:在一个非常大的数据帧列表上使用bind_rows 花费的时间比我想要的要长得多。有没有人...