窗口函数是一种SQL操作,它聚合在结果集的分区上。
我正在寻找问题的解决方案。我正在使用 Amazon Athena,需要一个字段来显示产品在 2 个时间戳之间的天数百分位数。我可以在亚马逊使用它
Trino/Presto SQ:仅当 NULL 出现在组中第一个非 NULL 值之后时,才将 NULL 替换为值
我想用指定的字符串替换NULL值。但是,我只想对第一个非 NULL 之后的 NULL 值进行此替换。意思是,如果 NULL 值在第一个值之前...
PySpark 窗口函数:rangeBetween/rowsBetween 上的 orderBy 中的多个条件
是否可以创建一个窗口函数,它可以在 orderBy 中为 rangeBetween 或 rowsBetween 有多个条件。假设我有一个如下所示的数据框。 user_id 时间戳...
如果客户有资格购买多种产品,如何根据 SQL 中的下一个最佳报价模型对客户进行排名
我有一组有资格购买某种类型产品的客户: 顾客 产品 约翰 香蕉 约翰 苹果 约翰 橙子 卡拉 香蕉 卡拉 苹果 卡拉 橙子 我也有一个模型
当我有一列包含分隔值时,我可以使用 unnest() 函数: 我的表 编号 |元素 ---+------------ 1 |ab、cd、efg、嗨 2 |jk,lm,no,pq 3 |rstuv,wxyz 选择 id,取消嵌套(string_to_array(
问题描述 我有一个表 (#tmstmp),其中包含 2 列 dt (DATETIME) 和有效负载 (INT)。最终我想对每 5 分钟间隔的有效负载求和。 代码 设置 声明@开始日期时间...
使用窗口函数 sum over () 计算队列 SQL 的运行收入
我正在尝试计算每个队列组内的运行总和(收入)。 我正在使用以下查询来实现此目的: round(sum(SUM(i.subtotal)) OVER (PARTITION BY cft.cohort_start order by
基于前面行的值:当 x>2 时重复 1,当连续 3 行 x=0 时重复 0
我的任务: 变量 x 和 def 分别是计数器和布尔值。两者都从零开始。 如果在任何时间点 x > 2,则从该点开始 def = 1。 现在如果 def = 1 那么为了...
MySQL:使用 ORDER BY + GROUP BY + GROUP_CONCAT() + COUNT(*) OVER() 窗口函数查询时排序顺序错误
显然,当查询具有 ORDER BY + GROUP BY + GROUP_CONCAT() + COUNT(*) OVER() 窗口函数时,排序在 mysql 8 中以某种方式错误地应用(在 8.0.33 到 8.0.35 上检查)。请参阅下面的测试用例(
我有一个表,我需要为 count(distinct(pay_type)) > 1 的员工创建一个计算字段,其中包含总薪酬。 当 count(distinct(pay_type)) > 1 为 true 时,我想要 ...
我在 Snowflake 中有事件表,每个事件一行。状态可以是失败(暗示有错误)或完成(暗示错误已解决)。对于每个 customer_id,我想找到两个已解析的时间戳...
我正在 leetcode 上练习 SQL,遇到了以下问题 - 我很困惑为什么我的解决方案不起作用。 以下是员工表,其中显示了哪个部门
我发现一个问题可以用 where 子句中的 Row_Number() 函数来回答。当我尝试一个查询时,我收到以下错误: 消息 4108 15 级状态 1 第 3 行 窗口函数可以...
SQL - Oracle 19c 的问题: 我使用分析函数运行数据集(使用分区依据,不排序)。对于每一行,我想将当前行与其余行进行比较
这里是数据集:(所需输出在图像中以粗体突出显示)尝试在 Snowflake SQL 上执行此操作,图像中的 F 列解释了如何导出 E 列 我想要第 5 栏,
我正在 MySQL 上使用来自 Kaggle 的 Netflix 数据集。数据集包含 Country、Subscription_Type、Age、Gender、Monthly_Revenue 等字段。在 Subscription_Type 列中,...
此查询返回每个用户在一小时内失败的存款次数。它仅过滤 5 个或更多失败的存款。 但是,现在我只需要过滤已创建 5 或
我想知道是否有人能够帮助我完成这个更新声明 我有大约 300 条左右的客户记录,其中包括地址、检查记录、注释等数据,所有这些数据...
我的数据库中有两个表,如下所示: 类别表: 列名 柱型 ID INT 姓名 文本 ID父母 双倍的 和广告表: 列名 柱型 ID INT 用户ID INT
Polars 窗口函数中的聚合 - 如何根据其他列的聚合选择顶部值
我有一个关于海运的大型数据集,其中包括 bol、voyage_id、承运人和总集装箱 (teus) 的列,类似于: lf = pl.LazyFrame({ 'bol_id':(1,2,3,4,5,6,7,8,9), '