dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

For 循环 - 从现有数据帧的列/唯一行值迭代创建矩阵/向量,并传递到后续代码

我是在 R 中编写函数和循环的新手,并且想要跨数据帧中的列迭代一大块代码,以创建新的结果矩阵。我陷入了如何迭代的困境......

回答 1 投票 0

根据条件进行变异

我正在尝试使用 mutate + ifelse 在数据集中创建一个新变量。 我的示例数据集如下 df = 结构(列表(id = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), resp_gender = c("女"...

回答 1 投票 0

在R中,如何在每个堆叠的条上放置误差条,特别是在使用facet_grid时?

这是一个数据集 df=数据.frame( 品种=代表(c(“CV1”,“CV2”),每个= 8L), 部分=代表(代表(c(“DW1”,“DW2”),2),每个= 4L), 光 = 代表(代表(c(“...

回答 1 投票 0

filter() 函数在 for 循环中不起作用

我写了下面的代码 miRNA.列表 <- c("let-7a-5p", "let-7a-1-3p", "let-7b-5p") summary.df <- data.frame() for (miRNA in miRNA.list) { temp.name <- miRNA...

回答 2 投票 0

在多个嵌套数据帧上匹配元数据

我正在从 API 中提取指标数据,该 API 会返回包含不同大小的嵌套数据帧的数据帧,以保存其他元数据。我正在尝试将其矩形化,但运气不佳。

回答 1 投票 0

编写自定义延迟评估函数(如 dbplyr)来获取 SQL

我该如何编写这个函数的逻辑,它应该能够做两件事。 获取数据<- function(database, table=NULL, query=NULL){ rlang::check_required( x = database ) if(i...

回答 1 投票 0

按组选择前 n 个值,其中 n 取决于数据框中的其他值

我对 R 和编码总体来说还很陌生。我们将非常感谢您的帮助:) 我正在尝试按组选择前 n 个值,其中 n 取决于其他值(在下面称为因子)...

回答 2 投票 0

我想用这样的方式总结R中的一个巨大的数据框,我只需要唯一的“lat”,“lon”,“Date(Year)”和“Maxium Value”

我需要总结一个巨大的CSV文件(nrow = 1102300)。这是来自各种气候模型的每日气候数据。 首先,我想总结所有具有“历史”名称的列。我的目标是...

回答 1 投票 0

箭头中的distinct(.keep_all = TRUE)的替代品?

我有一个比内存更大的箭头数据集,由 open_dataset() 从分区镶木地板文件创建,我需要在其上使用distinct(.keep_all = TRUE)。我需要将计算保存在磁盘上,因此...

回答 1 投票 0

按字符类型对行进行排序

我需要对列字符类型的行进行排序,首先显示从最高到最低排序的数字,然后显示带有“<" in a specific order: first "”的字符 我需要对列字符类型的行进行排序,首先显示从最高到最低排序的数字,然后显示带有“<" in a specific order: first " 来自: 致: data.table::data.table(Resultado = c("1,39", "5,89", "3,12", "0,25", "<LCM", "<LDM", "<LDM", "<LCM")) 将变量转换为.character()。 接下来,定义自定义订单。 然后重新排序。 dt <- data.table(Resultado = c("1,39", "5,89", "3,12", "0,25", "<LCM", "<LDM", "<LDM", "<LCM")) dt[, Resultado := as.character(Resultado)] custom_order <- c(rev(sort(dt[!Resultado %like% "<"][order(-as.numeric(gsub(",", ".", Resultado)))]$Resultado)), "<LCM", "<LDM") dt <- dt[order(match(Resultado, custom_order))] > print(dt) Resultado 1: 5,89 2: 3,12 3: 1,39 4: 0,25 5: <LCM 6: <LCM 7: <LDM 8: <LDM

回答 1 投票 0

使用 case_match() 和 char 数组重新编码值

在 dplyr 包中,recode() 已被 case_match() 取代。有没有办法使用存储在 char 数组中的标签来使用 case_match() 重新编码值? 例如,与 r...

回答 1 投票 0

R:使用 case_match() 和 char 数组重新编码值

在 dplyr 包中,recode() 已被 case_match() 取代。有没有办法使用存储在 char 数组中的标签来使用 case_match() 重新编码值? 例如,与 r...

回答 1 投票 0

自动更改列表的列表

如何改变 10 列,如果基因在模块内则包含 TRUE,如果不在模块内则包含 FALSE? gene_express = data.frame(gene = c('基因1', '基因2', '基因3', '基因4', '基因5', '基因...

回答 1 投票 0

更高效的汇总/R 中的汇总

我有执行大量汇总的代码,需要很长时间才能运行。 例如: 图书馆(dplyr) df <- data.frame(Letter = letters, Num = c(1 : (26*10) )) for (x in 1:10000){ df_sum_Tot =

回答 1 投票 0

如何获得R中唯一的组合组?

我正在对一些数据进行分组,例如实体数据。我根据一些实体属性找到了组,如下所示: df <- data.frame(uniq_index.x = c(1426, 1426, 1426, 1426, 7796, 7796, 7796,

回答 1 投票 0

如何汇总数据并将新行绑定到现有数据框?

编辑以回应评论。 我正在阅读加州 58 个县几年来的公共气温数据。我想创建一个摘要,即全州每日平均值,然后输入

回答 1 投票 0

海量数据集 - 按月份和位置计算的平均值

我非常感谢您对一些数据进行排序以减少我拥有的海量数据集(近 2600 行)的时间自相关性方面的帮助。我确信这可能是一个相当简单的事情...

回答 1 投票 0

同年上个月的份额减去当月的份额

对于每一年,我想从同年内上个月的份额中减去当月的份额,除了一月份,从份额中减去一月份的份额...

回答 1 投票 0

根据与两列匹配的另一个数据帧覆盖数据帧中的值

我有一个数据框,其中第一列有日期,第二列有 ID,其他列有值。一列中的一些值(假设是第三列)应该更新或插入

回答 1 投票 0

在 R 中将数组汇总到数据帧中

我想知道如何将下面的表格转换为我的 Desired_output? 在我的 Desired_output 中,n_study 是 TABLE 中与研究以外的列对应的值不为 0 的行数。 对于e...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.