我对使用预测模型还比较陌生,希望有一些集思广益的帮助/可行性评估。
我目前在2018年至今的数据集中有以下变量,每笔订单有一行
我想按项目类别预测今年剩余几周的每周销售额。目前,我最喜欢使用R。
鉴于我想按类别预测每周销量,您会建议使用哪种算法/程序包?
最简短的答案是从一组整理包开始。 dplyr的group_by()
在某种程度上计算值非常强大。对我来说,听起来您的数据已经整齐了,最适合tidyverse框架,因为它使人们可以轻松地对data.frame进行矢量化操作。查看他们必须提供的主要软件包及其概述here。首先从更简单的模型开始,例如lm()
,然后如果需要,继续使用更高级的模型。您将使用哪个变量作为预测变量?
无论您选择哪种模型,构建合适的模型后,都可以将内置的predict()
与group_by()
功能一起使用。有关基本预测here的更多详细信息。
顺便说一句,我看不到您所谈论的数据集,只能看到它的描述。您能否提供代表性样品的链接?这将使我能够提供更深刻的见解。