tidyr是Hadley Wickham用于清理和重塑数据的R软件包,旨在使用magrittr管道(%>%),以便与dplyr和类似的可管理软件包很好地交互,这些软件包强调整洁的数据。 tidyr是reshape2的继承者。
我想研究一些股票或金融指数。我使用 yfR 包和 yf_get 函数从雅虎财经下载数据。该函数返回一个带有许多变量的 df 。我想看...
我正在尝试编写一个使用pivot_longer的函数,并且想使用我的函数对象作为pivot_longer中names_to参数的对象。 记录<- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
tidyr::nest() 创建数据帧/小标题的列表列: 图书馆(tidyverse) 鸢尾 %>% 巢(数据 = c(-物种)) #> # 小标题:3 × 2 #> 物种数据 #> ...
可以说我有一个像这样的数据框(我的问题的简化、类似版本): 身份证号<- c(1,2,3) value <- c("1+4-3", "2+7-6+4-3", "-1+3") df <- data.frame(ID,
可以说我有一个像这样的数据框(我的问题的简化、类似版本): 身份证号<- c(1,2) value <- c("1+4-3","2+7-6+4-3") data.frame(ID,value) ID value 1 1+4-3 ...
我搜索了又搜索,发现了类似的东西,但没有什么是完全正确的。希望这个问题还没有得到解答。 假设我有一列包含 Y、N,有时还包含额外信息 df<-
如何从R中下面的data.frame获取到另一个data.frame。我是 dplyr/tidyr 的新手,所以不知道到底要使用哪些函数,但我想可以使用这些包来完成。 姓名
我有一个 data.frame,其 id 由字母数字字符序列组成(例如 id = c(A001, A002, B013))。我一直在寻找 stringr 或 Stirngi 下的一个简单函数,可以轻松地进行数学计算......
这个问题是这个问题的后续问题。 以下代码创建一个 tibble,其中包括 iris 数据集列 Sepal.Length、Sepal.Width、Petal.Length ...的经验分布
作为更大数据集的一部分,我的数据符合以下内容: 数据<- data.frame( ID = c(1,1,1,2,2,3,3,3,4,4,4,4), Event = c(1,0,0,0,0,0,0,0,0,1,0,0), Date = c(12-24-2019,12-25-201...
我正在将 CSV 读入 R,其中几列包含百分比,这些百分比的格式为文本字符串,末尾带有百分比符号,例如“35%”。 readr::read_csv() 解释这些...
我正在尝试加载一个vcf文件(使用data.table :: fread使用GATK创建,然后将FORMAT和示例字段的结果解析到不同的列中。列名由FOR给出...
我意识到以前可能有人问过这个问题,但我正在努力正确删除 df.txt 中的重复项。我已经使用了这里推荐的方法,但它并没有删除所有重复项。 #安装包...
我有以下数据集,Excel 中的度-分-秒坐标不整齐。我想将它们更改为十进制坐标。 纬度 经度 40 39' 05''N ...
我想 unnest() 一个数据框,其中 NULL 值存储为 list()。我该怎么做? 图书馆(dplyr) 图书馆(tidyr) df <- tibble::tribble( ~date, ~id, '2023-07-21',...
这是我的输入数据集,其中包含一行和 12 列/变量: df <- data.frame(q_q10=0,q_q20=0, q_q30=0,q_q40=400, q_q10_low=0,q_q20_low=0,q_q30_low=0,q_q40_low=350,...
我的数据框具有以下形状的值: 列 x1 y1 x2 y2 x3 y3 红色 23 0.5 25 0.7 30 0.8 蓝色 12 08 45 0.1 31 0.5 我需要将其转换为两列...
这与我在这里发布的问题类似。 我使用 nhlapi 包和 nhl_schedule_seasons 函数来获取特定赛季的比赛列表及其相关信息。 用这个来
我在 R 中有一个数据框,我想根据每列中的匹配值重新排列列。然而,在许多情况下,空行中的列不匹配。这是一个考试...
Tidyr/Dplyr:迭代计数,直到找到特定值。 “输入值 X 之前添加了多少条记录?”
我有一个呼叫日志数据集,我需要对其进行迭代计数,直到找到特定值。 这个想法是回答这个问题“在这个特定值是