假设我在表中有一些数据,t。
id, arr
--, ---
1, [1,2,3]
2, [4,5,6]
SQL
SELECT AVG(n) FROM UNNEST(
SELECT arr FROM t AS n) AS avg_arr
这会返回错误,
'Mismatched input 'SELECT'. Expecting <expression>
。
取消数组嵌套并聚合未嵌套值的正确方法是什么?
unnest
通常与join
一起使用,并将数组扩展为关系(即对于数组的每个元素都会引入一行)。要计算平均值,您需要将值分组:
-- sample data
WITH dataset (id, arr) AS (
VALUES (1, array[1,2,3]),
(2, array[4,5,6])
)
--query
select id, avg(n)
from dataset
cross join unnest (arr) t(n)
group by id
输出:
id | _col1 |
---|---|
1 | 2.0 |
2 | 5.0 |
但是您也可以使用数组函数。取决于 presto 版本
array_average
:
select id, array_average(n)
from dataset
或者对于旧版本,通过
reduce
手动聚合更麻烦的方法:
select id, reduce(arr, 0.0, (s, x) -> s + x, s -> s) / cardinality(arr)
from dataset