dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

测量动物位置和可再生能源之间的最短距离(需要时间精度)

我在 R 中创建了两个 sf 对象,一个用于动物位置,另一个用于涡轮位置。涡轮机 sf 包括施工开始和停止日期,以及每个结构的运行日期......

回答 1 投票 0

根据行和列值加入/填充数据

我正在尝试创建一个新的数据框,该数据框将与我的原始数据框重叠(因此,只要单元格中存在非 NA 值,新数据框中就有相应的值),这看起来有点......

回答 1 投票 0

删除向量中的 NA 字符

我有一个称为“子集”的字符向量,如下所示: 子集<- c("CASSDSTTDTQYF", "CASSYSTSGGANTGELFF", "CSAQPGQENQPQHF", "CASSQDGWGTGGGGEQF...

回答 1 投票 0

如何在 dplyr::filter 中使用变量?

我有一个与数据框中的列同名的变量: df <- data.frame(a=c(1,2,3), b=c(4,5,6)) b <- 5 I want to get the rows where df$b == b, but dplyr interprets this as df$b ==...

回答 5 投票 0

使用 R 从长格式纵向数据转换表

这个问题是关于如何使用R基本函数或dplyr等常用包从长格式的纵向数据生成频率跃迁表。考虑经度...

回答 1 投票 0

在 dplyr mutate 中递归填充日期

假设你有 啊<- tibble(date = ymd(c('20240101','20240102',NA, NA, NA))) How do you fill the NA values using the dplry mutate statement? This does not work. It only fill the first NA val...

回答 1 投票 0

日期和重叠日期功能

我正在尝试创建一个函数,在按 id、start_ins、rxdate 排序的数据中考虑重叠周期: dt <- data.table( id = c(1, 2, 2, 3,3,3), start_ins = as.Date(c('2...

回答 1 投票 0

使用 R 中的查找表进行分组重新编码

我有一个数据表,其中一个变量很混乱,并且可以包含相同值的不同变体(例如,球队名称纽卡斯尔联队或纽卡斯尔队)。这些变体与另一个分组一起出现......

回答 1 投票 0

R 中使用 duckdb + dplyr 的自定义函数

我喜欢使用 Dplyr 来清理/分析我的数据集,但我正在处理一些不适合我记忆的大数据集。因此,我修改了我的工作流程以包含 DuckDB。我现在面临的问题...

回答 1 投票 0

Dplyr Complete 不是用零填充空组合,而是用 1 填充

我的数据集中有一个空组合,我想用 0 填充,这样当我使用 geom_bar 时,我将拥有相等宽度的条形和间距。 这是我的数据和代码以及我创建的绘图,除了...

回答 1 投票 0

如何在一个select语句中同时使用starts_with和ends_with?

我想使用 dplyr 选择以 fy 开头并以 Give 结尾的所有列。我尝试了以下代码 df %>% select(start_with('fy') &ends_with('giving') 但它不起作用。 p/s: 交流...

回答 3 投票 0

包含 str_extract_all 的命令未在 mutate() 中返回预期结果

我有一个包含字符串的向量,每个字符串包含一个字母数字代码,其中整数的值为 1-3(例如“1RV2GA”)。我想提取数字并得到它们的总和。所以对于“1RV2GA&

回答 1 投票 0

根据值-布尔列对有条件地选择值

我有以下示例: var_1 <- c("1", "15", "35", "abc") var_1_is_deleted <- c("Yes", "No", "No", "Yes")...

回答 2 投票 0

我可以计算某个值的百分比并总结每个采样日期的此信息吗?

日期 树 化合物 化合物_mg %毫克 13.1 一个 C21 5 13.1 乙 C21 4 x 13.1 c C21 9 20.2 一个 C21 6 20.2 乙 C21 5 x 20.2 c C21 10 13.1 一个 C23 6 13.1 乙 C23 6 x 13.1 c C23 10 20.2 一个 C23 5 20.2 乙 C23 4 ...

回答 1 投票 0

dplyr -- 使用自定义函数的不同结果

我试图找出为什么 exp_purch 变量的这些结果彼此不同。 这似乎有效。 图书馆(dplyr) 数据3<- tibble( customer = c(1,2,3), frequency = c(30,32,36), re...

回答 1 投票 0

按负值比例过滤向量

我有一个具有有序负值和正值的向量: x <- c(-35, -30, -25, -20, -15, -10, -5, -2, 0, 5, 22, 77) I need to filter the values in the vector by a certain proportion of the

回答 2 投票 0

根据值-布尔列对有条件地选择值

我有以下示例: var_1 <- c("1", "15", "35", "abc") var_1_is_deleted <- c("Yes", "No", "No", "Yes")...

回答 1 投票 0

使用 dplyr 计算数据框中行的子集总和

不知何故,当我尝试对组中的前几行求和时,我在 dplyr 中遇到错误。 我尝试在 dplyr 之外重建问题,它工作正常,没有错误。谁能建议我在做什么

回答 1 投票 0

过时的数据掩码迟迟无法解决

大家好,我有一个关于非标准评估的问题。我拟合了一些具有不同结果变量的模型,并像这样计算边际效应。 图书馆(棕榈企鹅) 图书馆(边际效应)

回答 1 投票 0

dplyr::group_by 删除自定义类

我正在尝试实现一个带有自定义打印方法的 tibble 子类。我认为 dplyr::group_by 默默地删除了我的自定义类,结果是我的 S3 打印方法......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.