如何在第一周和上周不完整的每周聚合?

问题描述 投票:1回答:1

我想按周汇总价值。有时第一周或最后一周将少于7天。在下面的示例中,数据从2016-01-01开始,但该周的最低日期是2015-12-27。所以每周总和是基于两天而不是七天。我理解这种行为是完全符合逻辑的,但我想,第一周和最后一周(可能包含不到7天的数据)在图中没有显示为低值。我怎样才能做到这一点?我应该省略第一周和上周吗?我应该在这里使用平均值吗?怎么样?

expenses <- data_frame(
  date=seq(as.Date("2016-01-01"), as.Date("2016-12-31"), by=1),
  amount=rgamma(length(date), shape = 2, scale = 20))

plot_df <-  expenses %>% 
  mutate(Week = floor_date(date, "week")) %>%  
  group_by(Week) %>% 
  summarize(exp_sum = sum(amount))

ggplot(data = plot_df, 
       aes(x = as.Date(Week), y = exp_sum)) + 
  geom_line() +
  geom_point() + 
  scale_x_date(date_breaks = "1 week", date_labels = "%W")

Plot Example

r datetime aggregate lubridate summarize
1个回答
1
投票

由于期间不包括相同的天数,我的第一个建议是删除它们,为此你应该只选择你的数据库减去第一行和最后一行。这非常简单,它是在一条线上完成的。

plot_df <- plot_df[-c(1,nrow(plot_df)),]

第二种方法是添加所有值的平均值。但是,这应该反映在结果中。

plot_df[c(1,nrow(plot_df)),"exp_sum"] <- mean(plot_df$exp_sum)

我的最后一次尝试是分配它之前或之后的值:

plot_df[1,"exp_sum"] <- plot_df[2, "exp_sum"]
plot_df[nrow(plot_df), "exp_sum"] <- plot_df[nrow(plot_df)-1, "exp_sum"]

正如我告诉过你的,我会把它们抹掉。

© www.soinside.com 2019 - 2024. All rights reserved.