tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。
将多列的pivot_longer转换为单个names_to和两个values_to
我花了一天的大部分时间来处理这个问题,最后终于寻求了一些帮助。 这里有多个关于相关问题的条目,但没有一个条目完全理解我想要做的事情。 下面是一个例子 df....
我有一个 R 数据框,其中包含体育比赛的结果。 每行代表两名球员之间的一场比赛,列中包含比赛日期、球员姓名和每位球员的得分。 ...
如何避免在 tidyr::complete() 中输入变量名
在 tidyr::complete 中,我必须输入变量名称,如何避免?实际上,变量有很多,一一输入很无聊...有人可以帮忙吗?谢谢! 图书馆(tidyverse) 拉...
我有一个(不可共享的)疾病病例数据框(每一行都是一个患有疾病的人)以及对应于他们的年龄组(Age_Grp_15)和边缘化五分位数的列(
即时从 mutate(across()) 中子串化 {.col}
假设我有以下数据: df <- structure(list(treat = structure(1:4, levels = c("Control", "Alexander Hamilton", "Politicians pay attention", "Mark your
在 R 中,我有一个具有唯一名称-值组合的数据框: 数据 <- data.frame( name = c('a', 'a', 'b', rep('c', 3)), value = c('d1', 'd12', 'd123', 'b1', 'c12', 'd1234') ) > 数据 不...
我有一个包含许多列表列的数据框。 df <- tibble::tibble( a = list(c(1,2), c(3,4)), b = list(c(1, 2), 'a') ) I would like to unnest() all of them at once. However, one of ...
如何在 unnest_longer() 中使用 ptype 参数
我有一个看起来像这样的数据框。 图书馆(tidyverse) # 创建一个带有列表列的数据框 df <- tibble( id = c(1,2), lst = list(c(1,2), c('a', 'b')) ) df #> # 提布...
我有一个.xls文件,代表从1955年到2023年的每一天。文件命名如下:day_1955_1.tif.xls、day_1955_2.tif.xls...等等,非闰年的365个文件还有366天的闰年档案...
在R中,尝试在大型数据集上按组实现以下过滤逻辑: 每组内: 如果超过 1 个 L,则保留 L 值最低的行。 如果超过 1 N,则保留该行...
我有编程和 R 语言的新手经验。我的数据集样本如下: 图书馆(tidyr) 图书馆(dplyr) subsest_df <- data.frame( Condition = c("Oxidative&...
给定一个数据集,其中包含分组变量和一列不完整的整数(包含 NA),并且起始和结束整数因组而异,并且每组的长度也不同......
仅返回 R 中所有其他列的列 ID 和年份缺失 (NA) 数据的列表
ID 年 数学子 工程子 化学_sub Comp_sub 1 2010年 20 15 12 不适用 2 2015年 17 号 20 14 16 3 2012年 不适用 17 号 12 不适用 4 2015年 14 13 不适用 不适用 5 2016年 不适用 不适用 不适用 不适用 6 2015年 不适用 不适用 不适用 不适用 你好,我想知道 ab...
R/dplyr - 根据 2 行删除重复项并指定每列要执行的操作
我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...
假设我在 R 中有一个特定的字符串,比如“ABCDEFG”。我可以使用以下正则表达式将其分成每两个字符的序列。 strsplit("ABCDEFG", "(?<=...
我进行了一项分析(背景说明如下),生成了一个表格,其中基因名称列表作为行名称。其中一些基因名称添加了额外的后缀,“.#&qu...
示例 DF: 国家 <- c('Australia', 'Italy', 'Peru', 'China') score <- c("0.091", "0.413,.", "-", "0.102,0.102,0.102,.,.,.,.,.,.,.,.") country_scores...
大家早上好,我已经阅读了一些有关用 R 进行列分割的内容,但我找不到如何解决我的情况。 我想使用 tidyr R 包中的“单独”功能来拆分
我想迭代数据框中的列,并根据分隔符将它们分成几部分。我正在使用 tidyr::separate,当我一次只做一列时,它可以工作。 例如: df<- data.
Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值
我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...