将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
我正在尝试创建一个新的数据框,该数据框将与我的原始数据框重叠(因此,只要单元格中存在非 NA 值,新数据框中就有相应的值),这看起来有点......
我有一个称为“子集”的字符向量,如下所示: 子集<- c("CASSDSTTDTQYF", "CASSYSTSGGANTGELFF", "CSAQPGQENQPQHF", "CASSQDGWGTGGGGEQF...
我有一个与数据框中的列同名的变量: df <- data.frame(a=c(1,2,3), b=c(4,5,6)) b <- 5 I want to get the rows where df$b == b, but dplyr interprets this as df$b ==...
假设你有 啊<- tibble(date = ymd(c('20240101','20240102',NA, NA, NA))) How do you fill the NA values using the dplry mutate statement? This does not work. It only fill the first NA val...
我正在尝试创建一个函数,在按 id、start_ins、rxdate 排序的数据中考虑重叠周期: dt <- data.table( id = c(1, 2, 2, 3,3,3), start_ins = as.Date(c('2...
我有一个数据表,其中一个变量很混乱,并且可以包含相同值的不同变体(例如,球队名称纽卡斯尔联队或纽卡斯尔队)。这些变体与另一个分组一起出现......
我喜欢使用 Dplyr 来清理/分析我的数据集,但我正在处理一些不适合我记忆的大数据集。因此,我修改了我的工作流程以包含 DuckDB。我现在面临的问题...
Dplyr Complete 不是用零填充空组合,而是用 1 填充
我的数据集中有一个空组合,我想用 0 填充,这样当我使用 geom_bar 时,我将拥有相等宽度的条形和间距。 这是我的数据和代码以及我创建的绘图,除了...
如何在一个select语句中同时使用starts_with和ends_with?
我想使用 dplyr 选择以 fy 开头并以 Give 结尾的所有列。我尝试了以下代码 df %>% select(start_with('fy') &ends_with('giving') 但它不起作用。 p/s: 交流...
包含 str_extract_all 的命令未在 mutate() 中返回预期结果
我有一个包含字符串的向量,每个字符串包含一个字母数字代码,其中整数的值为 1-3(例如“1RV2GA”)。我想提取数字并得到它们的总和。所以对于“1RV2GA&
我有以下示例: var_1 <- c("1", "15", "35", "abc") var_1_is_deleted <- c("Yes", "No", "No", "Yes")...
日期 树 化合物 化合物_mg %毫克 13.1 一个 C21 5 13.1 乙 C21 4 x 13.1 c C21 9 20.2 一个 C21 6 20.2 乙 C21 5 x 20.2 c C21 10 13.1 一个 C23 6 13.1 乙 C23 6 x 13.1 c C23 10 20.2 一个 C23 5 20.2 乙 C23 4 ...
我试图找出为什么 exp_purch 变量的这些结果彼此不同。 这似乎有效。 图书馆(dplyr) 数据3<- tibble( customer = c(1,2,3), frequency = c(30,32,36), re...
我有一个具有有序负值和正值的向量: x <- c(-35, -30, -25, -20, -15, -10, -5, -2, 0, 5, 22, 77) I need to filter the values in the vector by a certain proportion of the
我有以下示例: var_1 <- c("1", "15", "35", "abc") var_1_is_deleted <- c("Yes", "No", "No", "Yes")...
不知何故,当我尝试对组中的前几行求和时,我在 dplyr 中遇到错误。 我尝试在 dplyr 之外重建问题,它工作正常,没有错误。谁能建议我在做什么
大家好,我有一个关于非标准评估的问题。我拟合了一些具有不同结果变量的模型,并像这样计算边际效应。 图书馆(棕榈企鹅) 图书馆(边际效应)
我正在尝试实现一个带有自定义打印方法的 tibble 子类。我认为 dplyr::group_by 默默地删除了我的自定义类,结果是我的 S3 打印方法......
使用 ggplot2 根据 R 中水平百分比的组合对两个图进行排序
我在 R 中有一个数据框,其中有两列“国家”和“吸烟”这两个因素。 我想根据递减的(按国家/地区)总和“烟雾”来更改左图的排序(参见图像图)和...