我想计算每月执行一次可变任务的频率。 month变量是从1到12。
到目前为止,我仅设法计算出每项任务的执行频率:我想知道任务在输出中每月发生的频率,以便检测哪个月的任务最多/最少。
count(df,c('task'))
id_task id_user day completion_yesno day_created has_deadline deadline created_before active overdue completed_before
16416 37033 5272 61 0 61 1 172 0 0 0 0
16417 37033 5272 62 0 61 1 172 2 2 0 0
16418 37033 5272 63 0 61 1 172 2 2 0 0
16419 37033 5272 64 0 61 1 172 2 2 0 0
16420 37033 5272 65 0 61 1 172 2 2 0 0
16421 37033 5272 66 0 61 1 172 2 2 0 0
16422 37033 5272 67 0 61 1 172 2 2 0 0
16423 37033 5272 68 0 61 1 172 2 2 0 0
16424 37033 5272 69 0 61 1 172 2 2 0 0
16425 37033 5272 70 0 61 1 172 2 2 0 0
16426 37033 5272 71 0 61 1 172 2 2 0 0
16427 37033 5272 72 0 61 1 172 2 2 0 0
16428 37033 5272 73 0 61 1 172 2 2 0 0
16429 37033 5272 74 0 61 1 172 2 2 0 0
16430 37033 5272 75 0 61 1 172 2 2 0 0
16431 37033 5272 76 0 61 1 172 2 2 0 0
16432 37033 5272 77 0 61 1 172 2 2 0 0
16433 37033 5272 78 0 61 1 172 2 2 0 0
16434 37033 5272 79 0 61 1 172 2 2 0 0
16435 37033 5272 80 0 61 1 172 2 2 0 0
期望的输出:
id_task month freq
1 12 3
2 1 20
您可以通过dplyr软件包询问以下内容:
data %>%
> group_by(month) %>%
> count(id_task)
我认为这可以。 (: