tidyr 相关问题

tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。

将多列的pivot_longer转换为单个names_to和两个values_to

我花了一天的大部分时间来处理这个问题,最后终于寻求了一些帮助。 这里有多个关于相关问题的条目,但没有一个条目完全理解我想要做的事情。 下面是一个例子 df....

回答 1 投票 0

如何将两个汇总列转换为 R 中具有二进制响应的两列?

我有一个 R 数据框,其中包含体育比赛的结果。 每行代表两名球员之间的一场比赛,列中包含比赛日期、球员姓名和每位球员的得分。 ...

回答 1 投票 0

如何避免在 tidyr::complete() 中输入变量名

在 tidyr::complete 中,我必须输入变量名称,如何避免?实际上,变量有很多,一一输入很无聊...有人可以帮忙吗?谢谢! 图书馆(tidyverse) 拉...

回答 1 投票 0

汇总数据帧后没有为组返回数据时强制显示列

我有一个(不可共享的)疾病病例数据框(每一行都是一个患有疾病的人)以及对应于他们的年龄组(Age_Grp_15)和边缘化五分位数的列(

回答 1 投票 0

即时从 mutate(across()) 中子串化 {.col}

假设我有以下数据: df <- structure(list(treat = structure(1:4, levels = c("Control", "Alexander Hamilton", "Politicians pay attention", "Mark your

回答 1 投票 0

将每个唯一的名称-值组合与其他名称的名称-值组合进行比较

在 R 中,我有一个具有唯一名称-值组合的数据框: 数据 <- data.frame( name = c('a', 'a', 'b', rep('c', 3)), value = c('d1', 'd12', 'd123', 'b1', 'c12', 'd1234') ) > 数据 不...

回答 1 投票 0

如何确定哪一列导致了错误

我有一个包含许多列表列的数据框。 df <- tibble::tibble( a = list(c(1,2), c(3,4)), b = list(c(1, 2), 'a') ) I would like to unnest() all of them at once. However, one of ...

回答 1 投票 0

如何在 unnest_longer() 中使用 ptype 参数

我有一个看起来像这样的数据框。 图书馆(tidyverse) # 创建一个带有列表列的数据框 df <- tibble( id = c(1,2), lst = list(c(1,2), c('a', 'b')) ) df #> # 提布...

回答 1 投票 0

我想合并 .xls 文件

我有一个.xls文件,代表从1955年到2023年的每一天。文件命名如下:day_1955_1.tif.xls、day_1955_2.tif.xls...等等,非闰年的365个文件还有366天的闰年档案...

回答 1 投票 0

过滤跨列的分层逻辑 - 按类型更高或更低的值

在R中,尝试在大型数据集上按组实现以下过滤逻辑: 每组内: 如果超过 1 个 L,则保留 L 值最低的行。 如果超过 1 N,则保留该行...

回答 1 投票 0

将一列中给定行的值移动到对应于 R 中的不同行

我有编程和 R 语言的新手经验。我的数据集样本如下: 图书馆(tidyr) 图书馆(dplyr) subsest_df <- data.frame( Condition = c("Oxidative&...

回答 1 投票 0

使用 R 中的 tidyverse 按组完成整数序列

给定一个数据集,其中包含分组变量和一列不完整的整数(包含 NA),并且起始和结束整数因组而异,并且每组的长度也不同......

回答 2 投票 0

仅返回 R 中所有其他列的列 ID 和年份缺失 (NA) 数据的列表

ID 年 数学子 工程子 化学_sub Comp_sub 1 2010年 20 15 12 不适用 2 2015年 17 号 20 14 16 3 2012年 不适用 17 号 12 不适用 4 2015年 14 13 不适用 不适用 5 2016年 不适用 不适用 不适用 不适用 6 2015年 不适用 不适用 不适用 不适用 你好,我想知道 ab...

回答 1 投票 0

R/dplyr - 根据 2 行删除重复项并指定每列要执行的操作

我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...

回答 1 投票 0

如何在 R 中按照特定顺序分割字符

假设我在 R 中有一个特定的字符串,比如“ABCDEFG”。我可以使用以下正则表达式将其分成每两个字符的序列。 strsplit("ABCDEFG", "(?<=...

回答 1 投票 0

如何根据并非所有元素都包含的分隔符来分隔列表中的元素?

我进行了一项分析(背景说明如下),生成了一个表格,其中基因名称列表作为行名称。其中一些基因名称添加了额外的后缀,“.#&qu...

回答 1 投票 0

R:创建包含字符串最大值的新数据框列的更有效方法

示例 DF: 国家 <- c('Australia', 'Italy', 'Peru', 'China') score <- c("0.091", "0.413,.", "-", "0.102,0.102,0.102,.,.,.,.,.,.,.,.") country_scores...

回答 1 投票 0

在 R 中使用“单独”(tidyr)拆分数据帧的几列

大家早上好,我已经阅读了一些有关用 R 进行列分割的内容,但我找不到如何解决我的情况。 我想使用 tidyr R 包中的“单独”功能来拆分

回答 3 投票 0

应用 tidyr:: 分隔多列

我想迭代数据框中的列,并根据分隔符将它们分成几部分。我正在使用 tidyr::separate,当我一次只做一列时,它可以工作。 例如: df<- data.

回答 3 投票 0

Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值

我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.