使用multidplyr时如何拆分多列

问题描述 投票:3回答:1

TL;博士 如何从多列上的multiplyr拆分中进行“分区”?

动机: 我对使用32个核心中的一个进行辛勤工作的总结感到不满意,所以我正在尝试使用multi-dplyer我在多个列上操作。

例: 插图显示按单列分组,但是当我这样做时,我的其他分组列不予考虑。

码:

library(dplyr)
library(multidplyr)
library(nycflights13)

flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

那么分年,月,日如何?

这对我不起作用:

flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

我似乎无法做到这一点。你能指出一种正确或至少有效的方法来做到这一点吗?

r dplyr multidplyr
1个回答
1
投票

根据?partitionpartition的用法是

partition(.data, ..., cluster = get_default_cluster())

其中...是要分区的变量。不是传入变量列表,而是分别传入每个变量,即

partition(flights, year, month, day)
© www.soinside.com 2019 - 2024. All rights reserved.