将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
dplyr::sf 对象上的过滤器:`vec_size()` 中出错:! `x` 必须是一个向量,而不是一个 <sfc_POLYGON/sfc> 对象
我使用代码加载并过滤了一个geojson文件(https://downtownrecovery.com/downtowns-original.geojson) 库(dplyr);库(geojsonsf) 原始 <- geojson_sf("downtowns-original.geojson&
我有一个纵向数据框,由多个 ID 和每个 ID 的多个观测值 (OBS) 组成。根据次数 (OCC),观察结果会用每个新剂量 (ADMIN) 进行标记...
返回 TRUE/FALSE 列以检查一组列是否包含值/字符串[重复]
我有一个数据框,我想检查以“时间”开头的任何列是否包含特定值(例如“1”)。如果 1 列或多列包含该值,那么我想要获取 1 列包含...
R dplyr 计算数据框中两个日期变量之间的天数时出现意外结果
我求助于这个小组的集体专业知识。我有一个日期计算问题,上周我经历了很多迭代并尝试了解决方案,我想我正在失去我的......
我有两个数据框,比如 df1 和 df2,如下图所示。我想使用 R 通过通过路径列将 df2 列添加到 df1 来组合它们。然而,我希望这条路径能够重复多次......
我有一个很大的数据集,我需要计算多个列中“否”的总出现次数。 数据集是这样的: id = c(1,2,3,4,5,6,7,8) trat = c("a","b&quo...
何时应该在 dplyr::case_when 中使用 .default 而不是 TRUE
dplyr::case_when 有一个可选参数 .default,根据文档 .default 当所有 LHS 输入返回 FALSE 或 NA 时使用的值。 不过,这也可以
如何让 t.test 和 dplyr group_by/summarise 在 R 的函数中被识别?
我创建了一个函数,这样我就可以对数据集中的多个值执行多个统计过程:1)配对 t 检验,2)创建一个简单的箱线图,3)获取患者测量的汇总统计数据...
编辑(但尚未解决) 以下代码会导致错误: # num_src() == 6 & num_ong() == 4 的可能结果 唐尼斯=特里布尔( 〜epci.res,〜annee,〜an_muta,〜natloc3,〜n,〜pct,〜总计 博...
我想在数据框中创建一个新列,该列生成一个结合来自另外两列的信息的唯一值,无论顺序如何。 例子 df = tibble(x = c(1,2,3,3,4,10,9), y=c(2,1,9,9,9,1,...
我的数据仅在系列的第一行中有价值。像这样: 数据<- data_frame(no = c(1:10), day = c("day 1", NA, NA, NA, "day2", NA, NA, "day3", NA, ...
我在 case_when 中有一个不应该被评估的条件,但它在我的代码中导致了错误。如何仅在条件为 TRUE 时运行此函数? 图书馆(dplyr) #> 蒂布尔(x = &
假设我有两个单独的数据框。我想保留 df_old,但我想用 df_new 中的值替换这些值(具有共享列名)。我该怎么做呢? 所以“其他...
取自github。我正在尝试用正确的坐标替换地理编码中的错误。有什么解决方法或建议吗?谢谢!其他提交在我尝试时失败了。 图书馆(SF) #> W...
如何在参数值列表上进行“summarize”和/或“mutate”,而不需要外部“for”循环或生成额外的列?
我被要求生成这样的东西: 图书馆(“tidyverse”) df <- tibble( comparison_var = c(1:10), var_to_sum = runif(10, max = 10), other_var = runif(10, max = 50) )
这个问题与这个问题密切相关,我在R中采用了使用arrow和duckdb的混合方法。 我注意到,duckdb 表并不总是“持久”dplyr 查询,当
示例数据: tibble::tibble(id = c("101", "101", "101", "102", "102", "103"), 颜色 = c("蓝色", "蓝色", "重新...
dplyr 语法中的 R Arrow 和 duckdb 不持久
这个问题与这个问题密切相关,我在R中采用了使用arrow和duckdb的混合方法。 我注意到,duckdb 表并不总是“持久”dplyr 查询,当