dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

创建计数(带重置)变量

我有一个数据集,其中有事件发生的二进制指示器。从这个列表中,我想创建一个没有事件发生的连续时间步数的计数。举个例子...

回答 1 投票 0

如何检查R中某一列中的值是否在所有其他列中重复?

我有一个包含多个列的数据集,其中包含来自不同学校的信息。我正在标准化所有信息,因此所有学校都显示相同的信息。为此,我正在努力

回答 1 投票 0

在 R 中将数据帧重新格式化为宽格式

我想知道是否有办法将我的数据重新格式化为下面的 Desired_output? 数据<- read.table(header=T, text=" study time nt nc mt mc sdt sdc outcome 1 pre 2...

回答 1 投票 0

在 R 中将数据帧重新格式化为宽格式

我想知道是否有办法将我的数据重新格式化为下面的 Desired_output? 数据<- read.table(header=T, text=" study time nt nc mt mc sdt sdc outcome 1 pre 2...

回答 1 投票 0

根据最近日期更新非缺失值[重复]

我的数据对每个 ID 有多个观察值。在 ID 级别,我想将所有值转换为最新的非缺失值。我尝试过使用 mutate、group_by(id) 和 which.max(year)

回答 1 投票 0

使用列表列作为 case_when 的 LHS 的输入

我在使用列表列作为 dplyr::case_when() 的 LHS 输入时遇到问题。 库(“dplyr”) 图书馆(“蒂布尔”) 图书馆(“咕噜”) # 创建一个 tibble 并...

回答 2 投票 0

dplyr 中各组之间的差异

我在 R 中有一个像这样的数据框: df = 数据.frame( 重复 = c(1,1,1,2,2,2), 组 = c("a", "b", "c", "a", "b", "c"), 分辨率 = c(1...

回答 1 投票 0

根据 2 行删除重复项并指定每列要执行的操作

我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...

回答 2 投票 0

sparklyr 中堆空间不足,但内存充足

即使在相当小的数据集上,我也会遇到堆空间错误。我可以确定我没有耗尽系统内存。例如,考虑一个包含大约 20M 行和 9 列的数据集,并且 t...

回答 2 投票 0

将数据帧变量传递给 ggplot2 函数

问题: 无法解析在scale_y_continous中传递给ggplot2的df变量 目的: 动态执行具有比例的辅助轴。 我的解决方法目前是手动写入总和......

回答 1 投票 0

R/dplyr - 根据 2 行删除重复项并指定每列要执行的操作

我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...

回答 1 投票 0

对时间上连续的值进行分组

我正在尝试对时间上连续的值进行分组。然而,我所能实现的就是标记那些连续的值(用“是”)。这里的问题是两个不同的组......

回答 1 投票 0

添加一栏来总结一周

我想在我的数据集中添加“周”列。本周专栏从第 1 周运行到第 5 周。我想将其添加到长数据集 (12) 行。 有没有办法我可以编码来实现这个功能

回答 1 投票 0

如何操纵数据来查找独特招聘人员的比例以及他们填补职位的日期[重复]

我正在尝试找出一种简单的方法来按[组]、[地理位置]和[已填补]细分独特招聘人员所填补的职位ID的比例。这最终将达到数万数据的规模......

回答 1 投票 0

R 通过字符串 r 中的索引连接数据帧

我正在尝试合并/连接两个数据帧 df 和 df2。 df 是根据在每个位置(第 4 个、第 10 个、第 12 个……字符)切割成字符串的字符向量生成的。初始向量looke...

回答 2 投票 0

对数据框进行子集化,以便保留包含 R 中某个变量的所有值的组合

让我们生成我们想要子集的数据帧 v日期 = 序列( 来自 = as.Date("2024-01-01"), to = as.Date("2024-01-5"), 通过 = 1 ) vToy = c(1, 2, 3) vColors = c(&q...

回答 1 投票 0

插入新行指示行之间的时间间隙

我正在处理演讲稿: 话语 Starttime_ms Endtime_ms 1 关于这个...

回答 1 投票 0

使用 dplyr 以多个列作为值来计算相对于基线的变化

我正在努力寻找一个 R 函数来将我的数据转换为“基线值的倍数变化”。基本上我有一个由 subject.id 和时间点组成的 data.frame,按

回答 1 投票 0

如何比较出现总数与特定标准的数量?

我有一个数据集,其中文章的名称按性别分隔。每篇文章都有一个索引号,因此看起来像这样: 指数 姓名 性别 角色 1 A 中号 引 1 乙 中号 引 2 C 中号

回答 1 投票 0

循环多列以应用条件转换

我正在尝试创建以下循环: 循环遍历 columns_to_check (10 列),如果没有值(即 NA)则 NA。结束循环。 如果不适用,则检查以下条件: 如果值为...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.