我想按周汇总价值。有时第一周或最后一周将少于7天。在下面的示例中,数据从2016-01-01开始,但该周的最低日期是2015-12-27。所以每周总和是基于两天而不是七天。我理解这种行为是完全符合逻辑的,但我想,第一周和最后一周(可能包含不到7天的数据)在图中没有显示为低值。我怎样才能做到这一点?我应该省略第一周和上周吗?我应该在这里使用平均值吗?怎么样?
expenses <- data_frame(
date=seq(as.Date("2016-01-01"), as.Date("2016-12-31"), by=1),
amount=rgamma(length(date), shape = 2, scale = 20))
plot_df <- expenses %>%
mutate(Week = floor_date(date, "week")) %>%
group_by(Week) %>%
summarize(exp_sum = sum(amount))
ggplot(data = plot_df,
aes(x = as.Date(Week), y = exp_sum)) +
geom_line() +
geom_point() +
scale_x_date(date_breaks = "1 week", date_labels = "%W")
由于期间不包括相同的天数,我的第一个建议是删除它们,为此你应该只选择你的数据库减去第一行和最后一行。这非常简单,它是在一条线上完成的。
plot_df <- plot_df[-c(1,nrow(plot_df)),]
第二种方法是添加所有值的平均值。但是,这应该反映在结果中。
plot_df[c(1,nrow(plot_df)),"exp_sum"] <- mean(plot_df$exp_sum)
我的最后一次尝试是分配它之前或之后的值:
plot_df[1,"exp_sum"] <- plot_df[2, "exp_sum"]
plot_df[nrow(plot_df), "exp_sum"] <- plot_df[nrow(plot_df)-1, "exp_sum"]
正如我告诉过你的,我会把它们抹掉。