tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。
为什么我必须重新安装软件包?当我尝试运行代码时,它会返回错误,直到我再次安装特定的包。可能是什么问题? 下面显示了问题,我...
我有一个具有重复 ID 的长列表格式的数据框。每个 ID 都有一个所谓的捐赠者号和时间点 (Tijdspunt)。一个 ID (Deelnemernr.) 可以有重复的时间点,如下所示: 德尔内默。
我有 Natura 2000 网络内外不同站点的大型数据集。 一个例子: df 姓名 总表面积 N2000 表面N2000 一个 1 是的 0.5 乙 5 不 不适用 C 11 不 不适用 D 10 是的 5 我想要...
在下面的代码中我试图完成一个日期序列。我的开始日期是 5 月 31 日,结束日期是 8 月 31 日。当我按下面的月份 seq() 时,您会看到跳过了 2023 年 6 月,但出现了 2023 年 7 月
对于具有命名行/列的矩阵,reshape2::melt() 的替代方案?
reshape2 包中的 Melt() 函数有一个方便的行为,它将具有命名行/列的矩阵转换为三列数据框,其中矩阵行/列名称变为...
pivot_longer() 具有并行(未链接)的列集[重复]
我正在尝试使用pivot_longer()来重新排列给定的数据集,这看起来像是数据库连接操作的结果。下面是它的示例: 数据 <- tibble('Plant_Name'...
假设一个像这样的数据框: df <- data.frame( total_income = c(100, 500, 2000), ten_twenty_k = c(90, 480, 300), twenty_one_thirty_k = c(10, 20, 1700), total_age ...
您好,感谢您阅读我的文章。我有一个具有以下结构的数据框: # 小题:6 × 2 customerId 交易历史...
在对话中的问题(话语)期间,我使用注视数据(此处,aoi_C_aoi 给出注视注视,aoi_C_dur 给出这些注视注视的持续时间)。我正在努力解决的问题...
如果列包含数字,如何在列中填充 NA,但如果列全部为 NA,则保留 NA
我正在创建一个文件,用于在模型中运行,其中包含我们多次访问过的多个不同地点的物种计数。然而,并非每次访问都访问了所有站点。 我需要一个专栏来
在 tidyr 包中,有关 `separate_longer_delim` 无法回收输入的问题
在下面的代码中,separate_longer_delim返回错误消息 在第 2 行中,无法将大小 4 的输入回收到大小 6。 如何修复它?谢谢! 图书馆(tidyverse) ori_df <- data.frame( Cat_A = c("...
eval_tidy() 适用于普通函数,但不适用于 tidyverse 函数
我正在尝试编写一个函数,有条件地在 dplyr 管道中应用子管道,但我一直坚持将子管道应用于数据。 我用quosur尝试了各种解散...
我对进行这个争论程序的确切方法有点困惑。 我有一个数据集,其中包含评估肺音的评估者(S1,...,S40)。对于每个声音评估
在 dplyr::mutate 中,dplyr::starts_with 适用于 .before 但不适用于 .after?
有人可以解释为什么在下面的上下文中, mutate .beforestarts_with 有效,但 mutate.afterstarts_with 不起作用? dfr_之前 <- data.frame(old1=1, old2=1, prefix_old1=1, prefix_old2=1, old3=1)
pivot_longer 具有非常大的 data.frame,内存高效的方法
我有一个包含 1100 万行的医院数据的 data.frame。 列:ID(字符)、结果 (1|0)、20x ICD-10 代码(字符)。 行数:1060 万行 我希望使数据整洁以允许诊断建模
我收到了一个txt数据文件,如下所示: # 测试 A 响应 c 1×1 1 2×2 0 …… 324×324 5 # 测试 P 响应 8 1×1 2 2×2 1 …… 501×501 4 # 测试 7
在 R 中,我尝试组合列对以找到列对之间的最大值。 我的数据框的结构如下: df <- data.frame(id = c("u1", "...
如何创建一个空的指定列并将该列放置到 R 中数据框中的特定编号位置
我有一个包含 388 列的数据框,并且我的数据框中有两列标记为“Longitude_E”和“Latitude_N”,其中包含以度、分和秒为单位的 GPS 坐标。 我的目标是创造...
对于有关人们职业的问题,我有多个回复数据。它们都在名为“职业”的列中,用逗号分隔(农民、公务员),但我在创建一个...
使用 tidyr 将不同长度和多个分隔符的字符串列分隔成新列
我想根据分隔符“:”将 prod_code_date 列(不同长度的字符串,从一个“对”到多个“对”)分成多个列...