将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
我正在使用代码从较大的数据集中过滤出较小的数据集。我选择 24 个月以下的儿童和另一个变量 (b9),该变量表示孩子是否与母亲住在一起。
相当于 df[duplicate(df[,subset]),] 的 dplyr 是什么,即对于基于子集列的每组重复项,保留除第一个匹配项之外的所有行? 这将显示所有重复的行,
使用pivot_wider后,我的列值显示为(列表)而不是(字符/数字/整数)
在开始之前先声明一下,我对 R 还很陌生;因此,如果我使用了错误的术语,请随时纠正我,如果需要更多信息来解决这个问题,请告诉我......
我有一个包含不同列的表格,其中包括 ID、观察年份和观察值。为简单起见,以下是传达我的问题的一个小示例: df = 数据.frame( ID=c...
我想使用基于比较日期的规则的自定义 ifelse 创建一些技巧。如果下一个日期的值高出 10% 与稍后的日期进行比较,然后重复旧值,如果不接受...
我有一个数据框,其中包含多个组的测量值。我想将外部应用到每对组并计算摘要。可以用 Tidyverse 风格完成吗?以下是如何...
我的数据结构如下: 位置示例 HeV NiV CedV GhV MenV 模拟“总事件” 74(1,B10) FSS27681 93 100 93 94 169 96 2392 75(1,C10) FSS26893 108 110 104 113 137 ...
使用通用数据: 设置.种子(456) 一个<- sample(0:1,50,replace = T) b <- rnorm(50,15,5) df1 <- data.frame(a,b) c <- seq(0.01,0.99,0.01) d <- rep(NA, 99) for (i in 1:99) { d[i] <...
我正在尝试改变一列,并用列表中的精确匹配项填充它(如果出现这些情况),如果没有,则填充可能最接近的匹配项。 我的数据框如下所示: 索引 <- seq(1, 10, 1) blo...
我试图了解如何简洁地实现诸如参数捕获/解析/评估机制之类的东西,该机制可以使用 dplyr::tibble() (FKA dplyr::data_fram...
pivot_longer() 具有并行(未链接)的列集[重复]
我正在尝试使用pivot_longer()来重新排列给定的数据集,这看起来像是数据库连接操作的结果。下面是它的示例: 数据 <- tibble('Plant_Name'...
我的数据设置如下: 我的数据<- data.frame( learner_code = 1:8, lsk = c(0, 10, 20, 30, 50, 15, 25, 40) I want to run the following code to first create categories within the lsk
我正在努力理解 dplyr::case_match() 在处理缺失值时的行为。假设我们有一个具有唯一值 1、2 和 NA 的变量,我们想要转换: 失踪了...
请耐心等待,我会尽力描述这一点。森林植被模拟器 (FVS) 是一种生长和产量模型,可以采用格式正确的 Excel 数据来预测...
我在 R 中创建了两个 sf 对象,一个用于动物位置,另一个用于涡轮位置。涡轮机 sf 包括施工开始和停止日期,以及每个结构的运行日期......
我正在尝试创建一个新的数据框,该数据框将与我的原始数据框重叠(因此,只要单元格中存在非 NA 值,新数据框中就有相应的值),这看起来有点......
我有一个称为“子集”的字符向量,如下所示: 子集<- c("CASSDSTTDTQYF", "CASSYSTSGGANTGELFF", "CSAQPGQENQPQHF", "CASSQDGWGTGGGGEQF...
我有一个与数据框中的列同名的变量: df <- data.frame(a=c(1,2,3), b=c(4,5,6)) b <- 5 I want to get the rows where df$b == b, but dplyr interprets this as df$b ==...