我想通过两个组级别获取最小值,例如,按季度划分最小值组,按商店划分按季度划分最小值。并寻找是否还有其他方法可以代替表连接,因为我认为表连接很慢。
例如,我有一个数据集
Date Quarter Year Store Price Sales Unit
1-1-2020 Q1 2020 A 1 1
31-1-2020 Q1 2020 A 3 0
1-2-2020 Q1 2020 B 2 1
1-5-2020 Q2 2020 A 4 3
1-9-2020 Q4 2020 B 5 9
预期结果
Date Quarter Year Store Price Sales Unit Min by Quarter Min by Quarter by Store
1-1-2020 Q1 2020 A 1 1 1 (1,3,2 in Q1) 1 (1,3 in store A and Q1)
31-1-2020 Q1 2020 A 3 0 1 1
1-2-2020 Q1 2020 B 2 1 1 2
1-5-2020 Q2 2020 A 4 3 4 4
1-9-2020 Q4 2020 B 5 9 5 5
谢谢
将GroupBy.transform
和GroupBy.transform
用于每个组的新列填充聚合值:
min