将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
在deply中,如何选择包含字符串[cat]或[b]的变量?
在 dplyr 中,如何选择包含 cat 或 b 的列? select(matches("('cat')('b')")) 似乎无法工作 图书馆(tidyverse) ori_df <- data.frame(ccat_a=1,wt=2,cat_b=1,cf=6,fbw=4) ...
如果列包含数字,如何在列中填充 NA,但如果列全部为 NA,则保留 NA
我正在创建一个文件,用于在模型中运行,其中包含我们多次访问过的多个不同地点的物种计数。然而,并非每次访问都访问了所有站点。 我需要一个专栏来
让 FSA 函数“Depletion”与 dplyr 一起使用时出现问题
在不深入了解应用程序细节的情况下,我需要在数据帧上运行 R 中的 FSA::depletion(function),其中该函数需要迭代运行以找到 X num 的“耗尽”值...
我有三个数据框,按年份描述某些标签的频率。每个 DF 具有相同的列标题,但其中一个缺少 1+ 列,因为频率为零,而一行则因为 t...
我有一个包含大约一百万条记录的大型数据框。我正在尝试使用 lubridate 来修复一些日期,但出现了奇怪的行为。当我在整个 data.frame 上运行它时,它无法解析任何记录...
sf:查找组的边界框并与 ArcGIS Pro 结果进行比较
我是 sf 新手,尝试为 sf 包中的分组点生成边界框(并计算其面积)。我能够得到看起来正确的边界框,但遇到了
dplyr::case_when 会抛出“无非缺失参数”且 na.rm=TRUE,即使在补偿所有 NA 情况时也是如此
我正在尝试计算跨行的最小值,同时补偿所有感兴趣的值均为 NA 的行: 图书馆(dplyr) 测试 Df <- tibble(a = 1:4, b = c(NA, 5:7), ...
R 中数据操作的 if_all 和 if_any 的替代方案
我一直在使用 dplyr 包中的 if_all 和 if_any 函数在 R 中进行数据操作。但是,我注意到这些函数在处理大型数据集时可能会非常慢。该...
我想创建一个新列,计算另一列的前 3 个观测值的累积平均值,并将结果填充到新列的其余部分。例如,假设我的...
我可以使用以下方法对数据进行长格式化: tidyr::pivot_longer(DATA, m:y, value_to= "z", names_to= "variable") ,它会在我的 Desired_output 中生成拉长的变量。 但我想知道...
我想执行条件为 colwise 的 rowwise if 语句。优选仅使用碱基R和dplyr。 图书馆(dplyr) 编号 <- c(1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5,...
我正在使用下面的 R 代码,但无法弄清楚如何获得具有两位小数的置信区间: 库(gtsummary) 调查::svydesign(id = ~PSU, 权重 = ~WT_analysis, 地层 = ~Str...
我想计算该数据集中 chla 变量的连续两个月中位数。我创建了一个 ID 键(ID = 当前月份,ID2 = 连续月份)来帮助计算。我...
我需要跨多组列进行透视,创建多个名称-值对。 例如,我需要从这样的事情开始: df_raw <- tribble( ~id, ~belief_dog, ~
eval_tidy() 适用于普通函数,但不适用于 tidyverse 函数
我正在尝试编写一个函数,有条件地在 dplyr 管道中应用子管道,但我一直坚持将子管道应用于数据。 我用quosur尝试了各种解散...
我有一个长格式的重复观察 ID 进场日期 -42365 胸骨切开术 18-11-2022 -42365 开胸手术 22-03-2024 -11234 开胸手术 12-03-2018 -11234 胸骨切开术 17-05-2023 我必须
如何在 dplyr 调用中通过两个变量进行 group_by() ?
我得到的是周(wk)的平均值,但是,第 21 周没有全部数据,所以我想 改为按“月”获取平均值。如何将 group_by(wk) 切换为 group_by(month) 相同的 dplyr 调用? ...
我想使用这样的 select 根据条件对列进行子集化: 选择(其中(〜sum(。)!= 0)) 但我只想在特定的列子集上执行此操作,如下所示: 选择(其中(〜总和(。)!= 0,.c ...