我试图基于包含 5 个分类列(业务、产品类型、供应商、地区和国家/地区)的表构建一个数据库,并将其作为销售额的衡量标准。
想法是通过 5 个分类列(总共 120 个不同的聚合)的所有排列来聚合销售额。
表格示例:
猫A | 猫B | 猫C | 销售 |
---|---|---|---|
橙色 | 西班牙 | 梅卡多纳 | 100 |
橙色 | 英国 | 乐购 | 100 |
草莓 | 爱尔兰 | 梅卡多纳 | 100 |
橙色 | 德国 | 梅卡多纳 | 100 |
橙色 | 西班牙 | Fnac | 100 |
草莓 | 德国 | 土星 | 100 |
橙色 | 土耳其 | CorteIngles | 100 |
蓝莓 | 法国 | Fnac | 100 |
随意使用表格作为基础,然后我可以推断到数据库。
总的来说,我对排列的目标是“快速”确定最大的 YoY 差异来自哪里,并希望根据正确的 A、B、C 或 D 顺序“自动化”对数据的一些评论/见解,以深入研究。
没有语言偏好,可以随意使用 R 或 Python。 我确实希望数据库的大小大大增加。
感谢您的宝贵时间! 亲切的问候, 凯莉安