我有一个如下所示的数据集
客户 ID | 日期 | 订单_id | 时间戳 |
---|---|---|---|
1 | 2024-01-01 | xy | 2024-01-01 18:47:33 |
1 | 2024-01-01 | zr | 2024-01-01 20:15:00 |
1 | 2024-01-06 | df | |
2 | 2023-12-01 | 嗯 | |
2 | 2024-01-05 | 简历 | |
3 | 2024-01-04 | ef |
我想要一个窗口函数,对于每个订单 ID,它为我提供客户 +/- 7 天的订单 ID(不包括当前行)。如果客户在 +/- 7 天的窗口内没有其他订单,那么它只会给我 1 行,并且
orders
列中为空。目前我正在使用自加入,但速度太慢
客户 ID | 日期 | 订单_id | 订单 |
---|---|---|---|
1 | 2024-01-01 | xy | zr |
1 | 2024-01-01 | xy | df |
1 | 2024-01-01 | zr | xy |
1 | 2024-01-01 | zr | df |
1 | 2024-01-06 | df | xy |
1 | 2024-01-06 | df | zr |
2 | 2023-12-01 | 嗯 | 空 |
2 | 2024-01-05 | 简历 | 空 |
我也面临着类似的问题!