tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。
我有一个.xls文件,代表从1955年到2023年的每一天。文件命名如下:day_1955_1.tif.xls、day_1955_2.tif.xls...等等,非闰年的365个文件还有366天的闰年档案...
在R中,尝试在大型数据集上按组实现以下过滤逻辑: 每组内: 如果超过 1 个 L,则保留 L 值最低的行。 如果超过 1 N,则保留该行...
我有编程和 R 语言的新手经验。我的数据集样本如下: 图书馆(tidyr) 图书馆(dplyr) subsest_df <- data.frame( Condition = c("Oxidative&...
给定一个数据集,其中包含分组变量和一列不完整的整数(包含 NA),并且起始和结束整数因组而异,并且每组的长度也不同......
仅返回 R 中所有其他列的列 ID 和年份缺失 (NA) 数据的列表
ID 年 数学子 工程子 化学_sub Comp_sub 1 2010年 20 15 12 不适用 2 2015年 17 号 20 14 16 3 2012年 不适用 17 号 12 不适用 4 2015年 14 13 不适用 不适用 5 2016年 不适用 不适用 不适用 不适用 6 2015年 不适用 不适用 不适用 不适用 你好,我想知道 ab...
R/dplyr - 根据 2 行删除重复项并指定每列要执行的操作
我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...
假设我在 R 中有一个特定的字符串,比如“ABCDEFG”。我可以使用以下正则表达式将其分成每两个字符的序列。 strsplit("ABCDEFG", "(?<=...
我进行了一项分析(背景说明如下),生成了一个表格,其中基因名称列表作为行名称。其中一些基因名称添加了额外的后缀,“.#&qu...
示例 DF: 国家 <- c('Australia', 'Italy', 'Peru', 'China') score <- c("0.091", "0.413,.", "-", "0.102,0.102,0.102,.,.,.,.,.,.,.,.") country_scores...
大家早上好,我已经阅读了一些有关用 R 进行列分割的内容,但我找不到如何解决我的情况。 我想使用 tidyr R 包中的“单独”功能来拆分
我想迭代数据框中的列,并根据分隔符将它们分成几部分。我正在使用 tidyr::separate,当我一次只做一列时,它可以工作。 例如: df<- data.
Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值
我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...
重塑 XYZ 数据框,使其有一列包含名称,三列包含 R 中的每个坐标
我有这个数据集,名为地标。 它有 3 个头骨(每行)和一组 3 个带 XYZ 的地标(BRG、LMB、OPI) 里程碑 <- structure(list(SNPRC = c("1X3930", "1X4286",...
为什么 R 库未在 app.powerbi.com 中加载?
我在 app.powerbi.com 上不断收到以下错误: “pivot_wider(数据,names_from=names,values_from=values)中的错误:找不到函数“pivot_wider”” 我加载“tidyr”
我有一个数据: 图书馆(locfit) 一个<- c("A", "A", "A", "A", "A","A","A","A","A","A","A","A", "B", "B", "B", "B", "B","B", "C", "C", "C", "C", "C","C","C...
我正在开发一个包,当我希望删除一个命名的全NA列而不删除其他也是全NA的列时,我遇到了麻烦。 这是数据框的示例。在这次考试中...
给定数组foo,如何使用pivot_longer制作data.frame栏?我有一个两步解决方案,使用pivot_longer,然后使用separate_wider_delim,但我可以在pivot_longer中完成这一切...
我有一个像这样的相关性矩阵: 数据<- (c(1,1,0.01,0.02,0.03,0.06, 1,1,0.01,0.02,0.03,0.06, 0.01,0.01,1,0.5,0.03,0.02, 0.02,0.02,0.5,1,0.02,0.03, ...
我尝试使用这篇文章中的答案使用基本R:将字符串拆分为R中的新行 split_dfcheck <- as.data.frame(do.call(rbind, apply(test, 1, function(x) { do.call(expand.grid,
是否有 R 函数允许您从数值变量中提取单个数字,无论其位置如何(不仅仅是第一个或最后一个数字?
我看过很多关于如何使用 gsub 或 grep 等函数提取数字变量中的第一个数字或最后一个数字的帖子,但是我希望能够提取特定的数字 regar...