我的 R 课程作业有以下问题:
数据集有以下变量: • “。 . . 1”——行计数器变量;简单地计算行数。
• “sales_outlet_id”- 编码为 3、5 或 8 的三个位置之一。
• “transaction_id” - 交易购买的 id。
• “数量”- 订单数量(1-8,但除少数异常值外,大多数为 1 或 2)。
• “transaction_time” - 交易购买的时间。
**1。 ** 与其他地点相比,人们在这三个地点之一(即奥特莱斯)购买的商品更多(即数量)吗?
我不确定对这个问题使用什么类型的分析(方差分析或回归)以及我将如何去做。
**第二个问题是:** 单价是否占购买交易时间影响客户的商品数量 买?
我再次不确定我可以在这里使用什么分析,也不确定我如何添加购买时间,因为我猜它必须重新编码。
任何帮助将不胜感激!
__
我目前尝试过:
第一季度:
combined_data$sales_outlet_id_factor <- as.factor(combined_data$sales_outlet_id)
lm_results <- lm(quantity ~ sales_outlet_id_factor, data = combined_data)
summary(lm_results)
plot (lm_results)
第二季度:
model2 <- lm(quantity ~ unit_price + transaction_time, data = combined_data)
summary(model2)