将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
我有一个包含三列的 df:名称、测试和值。他们描述了对某人的化学反应测量。 df <- data.frame(name=c("A","A","B","C",...
我想将列中的所有 NA 值更改为 0,将所有其他值更改为 1。但是,我无法使 case_when 和 is.na 的组合起作用。 # 创建数据框 一个<- c(rep(NA, 9), 2, rep(NA, 1...
我正在模拟不同参数值的模型。本质上,我获得了包含多个数据帧的列表对象结果。 图书馆(大众) 模型_测试版 <- 0 model_se <- 0 model_p ...
我想在下面的示例数据集中创建第五列,其中每行包含一个列 2:4 的列表。第一行所需的输出为 c(20,40,14),...
在 dplyr、ggvis、dycharts 等软件包中使用管道运算符 %>% 时,如何有条件地执行步骤?例如; 步骤_1 %>% 步骤_2%>% 如果(条件) 步骤_3 这些适合...
跨列应用多个汇总函数:summarise_all:无法强制“list”对象输入“double”
我正在尝试创建一个描述性统计表,为数据帧的每一列获取以下统计数据:平均值、标准差、第 10 个、第 50 个和第 90 个分位数。然后我想转置数据...
dplyr summarise_all:无法强制“list”对象输入“double”
我正在尝试创建一个描述性统计表,为数据帧的每一列获取以下统计数据:平均值、标准差、第 10 个、第 50 个和第 90 个分位数。然后我想转置数据...
根据初始指南编辑问题已关闭: 我有一个很大的数据集,在 12 年的时间里大约有 50 万个成员,我需要根据 elig_flag 和 Continuous_elig_counter 来确定
我有这样的数据: 图书馆(dplyr) 设置.种子(123) 数据<- data.frame( date = rep(1:3, each=3), grupo = rep(c("A", "B", "C"), 3), x = runif(9, 10, 50), y =...
我有一个数据框,如下所示: # 加载必要的库 图书馆(dplyr) # 创建数据框 测试<- data.frame( address = c("123 Elm St", "456 Oak St", "789 Pine...
dplyr::across 中的函数参数用于在多列上进行转换
我想使用 dplyr::across 将一些 [0,1] 变量重新编码为级别为 ["no","yes"] 的因子。我成功了,但我想了解如何定义函数参数...
我不明白 dplyr::arrange_at 在传递 .funs 参数时正在做什么。 例如假设我们创建一个数据框 Z: 图书馆(dplyr) <- expand.grid(A = c(1:2, NA), B = c(1:2, NA)) ...
如何使用distinct(..., .keep_all = TRUE) 但指定要保留哪一行?
假设我有以下内容: > df 坐标 1 A 1 o 2A 0米 3A 1克 我想保留独特的观察结果,而不考虑特定的列,例如: > dplyr::distinct(df, dplyr::across(-...
R Lubridate:将日期时间舍入/对齐到一天中最接近的任意时间?
我有一个日期时间列表,如下所示: 数据<- data.frame(datetimes = c(ymd_hms("2024-01-01 04:12:35"), ymd_hms("2024-04-01 14:52:20"...
使用 mutate 将更多变量粘贴在一起,而不对列名称 R 进行硬编码
我已经检查过以前的类似帖子,但没有找到我需要的解决方案。 我需要使用变异和粘贴将更多变量粘贴到新列中,但我需要避免硬编码......
Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值
我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...
我有一个数据框,根据使用的过滤方法给出不同的结果。请参见下面的屏幕截图,这看起来很奇怪。对于为什么会这样有什么想法吗?
我有一个大约 64,000 行的数据框,其结构如下 df <- data.frame(FY = c(2018, 2018, 2019, 2019, 2020, 2020), WorkArea = c("03218", "03219", "07589", "
数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),