窗口函数是一种SQL操作,它聚合在结果集的分区上。
在 Oracle SQL 中,我有来自不同人的汽车的时间序列数据(例如行驶公里数或以升为单位使用的汽油)。一些指标按工作日报告,其他指标按月或季度报告...
我正在使用 SQL 中的 LAG() 函数来计算每个出租车司机当月小费总和与上个月小费总和之间的差额。然而,LAG() 函数正在返回...
如何在pandas中用partition by模拟windows功能?
我在original_eur列中得到了带有空值的数据。 事件ID 类别 round_bot_date 原始欧元 0 43ee085d-40b4-44f7-bdf5-c9e649284527 第 1 类 2024-03-25 00:00:00 200 1 bd9a68b1-c62d-4481-a...
使用窗口函数运行 Total UDF(用户定义函数)会抛出“无法强制输出值”
输入数据集: 日期 ID 数字 期望的 2020-01-01 1 8 8 2020-01-02 1 11.5 19.5 2020-01-03 1 -20 0 2020-01-04 1 10 10 2020-01-05 1 -5 5 2020-01-06 2 -9 0 2020-01-07 2 26 26 2020-01-08 2 5 31
我正在尝试获取连续几天下订单的客户的ID。该表创建如下: 创建表订单( 订单号 INT, 订单日期日期, 客户 ID 整数 );
我想确定每一行在给定时间范围内先前记录的总数。 一个具体的例子: 克隆=# \d 测试 表“pg_temp_2.test” 专栏 | ...
在 Snowflake 中,我想计算数据的移动平均值,但平均值中的行数可能会发生变化。具体来说,我想将日期为 30 的所有记录计入平均值......
我有一张这样的桌子: ------------------------------------------ | DT |普林 | INT | ------------------------------------------ | 2023 年 1 月 1 日 | 100000 | 1100 | 1100 | 2023 年 1 月 2 日 | 100000 | 1200 | 1200 | 2023 年 1 月 3 日 | 1...
SQL Server 中的 COALESCE 函数返回 NULL,尽管有一个参数不为 NULL
有很多产品提供某种“SQL Server”,但只有微软的一个产品,因此我将其称为“MS SQL”,特别是当它涉及到它的语言时。 我有一个...
为什么WITHIN GROUP与PERCENTILE_DISC和PERCENTILE_CONT窗口函数一起使用
在提供此功能的每个数据库中,我都看到类似的语法: PERCENTILE_DISC( ) 组内(ORDER BY )超过([ PARTITION BY ]) 但是...
sql错误“解析函数不能是另一个解析函数的参数”是什么意思?
我编写了以下 SQL 查询来查找最大数量严格大于每个订单(包括其本身)的平均数量的订单。一个订单包含多个产品...
我有一组表,我想从中提取所有数据,其中的列列出了辅助表的内容。 例如: 状态 代码 姓名 增强现实 阿肯色州 CT 康涅狄格州 明尼苏达州 缅因州 参议院...
我正在寻找问题的解决方案。我正在使用 Amazon Athena,需要一个字段来显示产品在 2 个时间戳之间的天数百分位数。我可以在亚马逊使用它
Trino/Presto SQ:仅当 NULL 出现在组中第一个非 NULL 值之后时,才将 NULL 替换为值
我想用指定的字符串替换NULL值。但是,我只想对第一个非 NULL 之后的 NULL 值进行此替换。意思是,如果 NULL 值在第一个值之前...
PySpark 窗口函数:rangeBetween/rowsBetween 上的 orderBy 中的多个条件
是否可以创建一个窗口函数,它可以在 orderBy 中为 rangeBetween 或 rowsBetween 有多个条件。假设我有一个如下所示的数据框。 user_id 时间戳...
如果客户有资格购买多种产品,如何根据 SQL 中的下一个最佳报价模型对客户进行排名
我有一组有资格购买某种类型产品的客户: 顾客 产品 约翰 香蕉 约翰 苹果 约翰 橙子 卡拉 香蕉 卡拉 苹果 卡拉 橙子 我也有一个模型
当我有一列包含分隔值时,我可以使用 unnest() 函数: 我的表 编号 |元素 ---+------------ 1 |ab、cd、efg、嗨 2 |jk,lm,no,pq 3 |rstuv,wxyz 选择 id,取消嵌套(string_to_array(
问题描述 我有一个表 (#tmstmp),其中包含 2 列 dt (DATETIME) 和有效负载 (INT)。最终我想对每 5 分钟间隔的有效负载求和。 代码 设置 声明@开始日期时间...
使用窗口函数 sum over () 计算队列 SQL 的运行收入
我正在尝试计算每个队列组内的运行总和(收入)。 我正在使用以下查询来实现此目的: round(sum(SUM(i.subtotal)) OVER (PARTITION BY cft.cohort_start order by
基于前面行的值:当 x>2 时重复 1,当连续 3 行 x=0 时重复 0
我的任务: 变量 x 和 def 分别是计数器和布尔值。两者都从零开始。 如果在任何时间点 x > 2,则从该点开始 def = 1。 现在如果 def = 1 那么为了...