tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。
使用TIDYR单独的更宽的正则施用字母数字字符串 我有以下数据, id
id <- c("case1", "case19", "case88", "case77") vec <- c("One_20 (19)", "tWo_20 (290)", "Three_38 (399)", NA) df <- data.frame(id, vec) > df id vec 1 case1 One_20 (19) 2 case19 tWo_20 (290) 3 case88 Three_38 (399) 4 case77 <NA> <- c("case1", "case19", "case88", "case77") vec <- c("One_20 (19)", "tWo_20 (290)", ...
从文件中读取大型多部分表格,然后将其零件梳成一个tibble
我有以下结构的巨大文件(> 25 MB): 项目:时间段 0 项目:原子数 14748 项目:框边界SS SS SS -1.3314357502021994E+02 1.1517122459132779E+02 -1.3499049172495 ...
我如何加入/粘贴列与<- data.frame( id = c(1, 2, 3), `1` = c("W4", "W5", 49), `2` = c("L", "O1", "P6"), `3` = c(1, 2, 10), ...
我的数据中的一列如下所示: 数据 <- data.frame( A = c("M24656811 M24677722 GREEN,SMITH34/M/B", "M24654999 DOE,JANE V37/F/W", "M24333107 DOE,JOHN24/M/B&q...
我在 R 中有一个名为 df 的数据框架: df # 小标题:20 × 2 # 组:Professional_Assistance_Diet、How_successful_diet [9] 瓦尔瓦尔 ...
我有一列格式不一致的字符串,我试图使用 tidyr::separate_wider_delim() 对其进行拆分。它们的模式要么是“text[space]text”,要么是“text[space]text[
我在 R 中有一个称为 data 的数据框: 数据 # 小标题:192 × 4 年份类别 青睐比例 1 2002 年 35 岁好......
如何在 R 中将足球比赛数据帧转换为具有单独行的主队和客队的长格式
我在 R 中有一个 DataFrame,其中包含以下列: season:比赛的赛季(例如“2015/2016”) stage:比赛的阶段或回合(例如,1 表示第 1 轮) home_team_api_id:...
我有一个由调查现场创建的数据集,他们为一些标签引入了大写撇号。 当我使用 Haven 包导入它时,那些大写撇号仍然保留。 我...
为什么我必须重新安装软件包?当我尝试运行代码时,它会返回错误,直到我再次安装特定的包。可能是什么问题? 下面显示了问题,我...
我有一个具有重复 ID 的长列表格式的数据框。每个 ID 都有一个所谓的捐赠者号和时间点 (Tijdspunt)。一个 ID (Deelnemernr.) 可以有重复的时间点,如下所示: 德尔内默。
我有 Natura 2000 网络内外不同站点的大型数据集。 一个例子: df 姓名 总表面积 N2000 表面N2000 一个 1 是的 0.5 乙 5 不 不适用 C 11 不 不适用 D 10 是的 5 我想要...
在下面的代码中我试图完成一个日期序列。我的开始日期是 5 月 31 日,结束日期是 8 月 31 日。当我按下面的月份 seq() 时,您会看到跳过了 2023 年 6 月,但出现了 2023 年 7 月
对于具有命名行/列的矩阵,reshape2::melt() 的替代方案?
reshape2 包中的 Melt() 函数有一个方便的行为,它将具有命名行/列的矩阵转换为三列数据框,其中矩阵行/列名称变为...
pivot_longer() 具有并行(未链接)的列集[重复]
我正在尝试使用pivot_longer()来重新排列给定的数据集,这看起来像是数据库连接操作的结果。下面是它的示例: 数据 <- tibble('Plant_Name'...
假设一个像这样的数据框: df <- data.frame( total_income = c(100, 500, 2000), ten_twenty_k = c(90, 480, 300), twenty_one_thirty_k = c(10, 20, 1700), total_age ...
您好,感谢您阅读我的文章。我有一个具有以下结构的数据框: # 小题:6 × 2 customerId 交易历史...
在对话中的问题(话语)期间,我使用注视数据(此处,aoi_C_aoi 给出注视注视,aoi_C_dur 给出这些注视注视的持续时间)。我正在努力解决的问题...
如果列包含数字,如何在列中填充 NA,但如果列全部为 NA,则保留 NA
我正在创建一个文件,用于在模型中运行,其中包含我们多次访问过的多个不同地点的物种计数。然而,并非每次访问都访问了所有站点。 我需要一个专栏来