dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

按日期范围过滤多列,并计算R中的最大值

数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),

回答 1 投票 0

dplyr:如何使用distinct(..., .keep_all = TRUE) 但指定要保留哪一行?

假设我有以下内容: > df 坐标 1 A 1 o 2A 0米 3A 1克 我想保留独特的观察结果,而不考虑特定的列,例如: > dplyr::distinct(df, dplyr::across(-...

回答 1 投票 0

基于 ICD-10 标准的抑郁症严重程度 R 代码

我正在尝试根据 ICD-10 标准和 MDI(重度抑郁量表)的数据提出抑郁症严重程度的 R 代码。该调查问卷由 12 个问题组成(mdi_1、mdi_2、

回答 1 投票 0

如何用两个不同的表格和匹配信息创建新表格

我想用两个不同的数据表创建一个新表,就像这样。 表 1) 名称到代码:成对比较的匹配数据 #表格1 名称代码 甲乙 空调 广告 埃 乙...

回答 1 投票 0

重塑 XYZ 数据框,使其有一列包含名称,三列包含 R 中的每个坐标

我有这个数据集,名为地标。 它有 3 个头骨(每行)和一组 3 个带 XYZ 的地标(BRG、LMB、OPI) 里程碑 <- structure(list(SNPRC = c("1X3930", "1X4286",...

回答 1 投票 0

使用 group_by 自定义函数时出错并在 r 中的 dplyr 中汇总

我尝试使用 dplyr::group_by 编写自定义函数并进行总结。 但总是出错,“row.names”长度。 我简化了数据和代码,找到了原因。这是数据和代码: 瑟...

回答 1 投票 0

根据数据框中的特定值提取列名称

我有以下数据: 我的数据<- tribble( ~item1, ~item2, "car", "ferrari", "house", "3 bed", NA, "3" ) I am trying to extract the...

回答 2 投票 0

如何识别开始到结束日期范围与“目标”日期范围相交的情况

想象这个数据集。 图书馆(tidyverse) 库(润滑) df <- data.frame( ID = 1:10, start_date_smoking = c("28/06/2011", "27/07/2012", "09/04/2003", "...

回答 1 投票 0

使用 R 进行序列覆盖

我有一个包含 100 个氨基酸 (AA) 的蛋白质序列,可以作为数据框进行处理。每个 AA 都有一个位置,目前最重要的是位置: 蛋白质 <- data.frame(AA = 1:100) Tha...

回答 2 投票 0

在 R 数据框中计算访客持续时间:如何计算代理时间、房间时间和等待时间?

我有一个 R 数据框,其中包含来自机构的数据。访客 (ID) 进入代理机构 (CREATE),然后被叫到不同的房间 (CALL),并离开这些房间 (DISCHARGE)。现在,我想计算...

回答 2 投票 0

没有适用于“character”类对象的“inner_join”方法?

我正在尝试合并两个不同的列:Type.1 和 Type.2。两者具有相同的类型(字符),但是当我尝试 inner_join() 时,我收到以下消息: 图书馆(dplyr) 类型_联合 <- inne...

回答 1 投票 0

计算每列的平均值并排除行

我的数据包含 1000 列和 80 行,每五行对应一个组(第一列是类列)我想计算所有数字列的每个组的平均值,然后我...

回答 1 投票 0

对数据框中变量的每个值重复绘制 ggplot

我想为数据框中变量的每个值制作一个图表,然后将该值作为标题传递给图表。我认为最好的方法是使用

回答 3 投票 0

如何使用sql、python或r整合缓慢变化的维度表?

我有以下输入表: ID 类型 价值 日期_从 日期到 1 部门 金融 2020-01-01 9999-12-31 1 人数 10 2020-01-01 2020-02-03 1 人数 15 2020-02-04 9999-12-31 1 地点 直流 202...

回答 1 投票 0

如何在基于 `dplyr::arrange` 的 R 函数中使用一个参数对数据框进行升序或降序排序

下面的函数可以使用一个参数对多列数据框进行排序,并使用不带引号的列作为参数。 库(rlang) 图书馆(dplyr) #> #> 附加包:'dplyr' #>

回答 1 投票 0

将所有包含 ′ 的变量突变为 '?和其他符号到想要的一个?

如何使用 R 将所有包含 ' 的变量突变为 '? df <- data.frame( S=c("1′,@","2′2′abc","3:ae′","′4~@e′","55′","6:ae′"), Q=c...

回答 1 投票 0

如果列中存在相同的字符串,则对行值求和

我有一个数据框,看起来像 样本 价值 领域 S1 12 域_已识别_X13_A S1 25 域_已识别_X28_B S1 18 域名_未识别 我想聚合行的值,包括 stri...

回答 1 投票 0

当我尝试在数据框中使用“合并”函数时,为什么会出现回收错误?

我有一个包含多列的数据框,我想将其变成带有“合并”的一列。每个现有列都是每个位置(行)的不同深度数据源。我需要最后一个“...

回答 1 投票 0

我无法获取过去的数据(stop_words)来分析文本挖掘中的文本

这是我第一次尝试文本挖掘,但我遇到了困难。这是我到目前为止所做的: 图书馆(TM) 图书馆(整洁的文本) 图书馆(dplyr) 库(ggplot2) 文本 1 <- c("Dear land of G...

回答 1 投票 0

将数据拆分为训练集、验证集和测试集,ID 不重叠,并且仍然平衡目标类

我需要将大型数据集分割成一定比例的训练集、验证集和测试集,同时确保以下几点: 在每组中保留唯一的 ID。任何 ID 不能属于多于一组。 在每个

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.