unnest()
函数与元素编号当遇到包含分隔值的列时,unnest()
函数提供了一种提取这些值的方法:
myTable
id | elements
--- ------------
1 |ab,cd,efg,hi
2 |jk,lm,no,pq
3 |rstuv,wxyz
select id, unnest(string_to_array(elements, ',')) AS elem
from myTable
id | elem
--- -----
1 | ab
1 | cd
1 | efg
1 | hi
2 | jk
...
但是,您可能希望也包含元素编号,格式如下:
id | elem | nr
--- ------ ---
1 | ab | 1
1 | cd | 2
1 | efg | 3
1 | hi | 4
2 | jk | 1
...
最终目标是在不使用窗口函数(如 row_number()
或 rank()
)的情况下获得源字符串中每个元素的原始位置,因为这些函数始终返回 1,这可能是因为所有元素都位于源表的同一行中。
对于逗号分隔的字符串,请使用 string_to_table()
代替 unnest(string_to_array())
:
SELECT t.id, a.elem, a.nr
FROM tbl t
LEFT JOIN LATERAL string_to_table(t.elements, ',') WITH ORDINALITY AS a(elem, nr) ON true
对于返回集合的函数,使用 WITH ORDINALITY
:
SELECT t.id, a.elem, a.nr
FROM tbl AS t
LEFT JOIN LATERAL unnest(string_to_array(t.elements, ',')) WITH ORDINALITY AS a(elem, nr) ON true
LEFT JOIN ... ON true
确保保留左侧表中的所有行,而不管右侧表表达式是否返回任何行。
或者,由于 LEFT JOIN ... ON true
保留了所有行,因此可以使用更简洁的查询版本:
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr)
对于实际数组(arr
为数组列),可以使用更简洁的形式:
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr)
为了简单起见,可以使用默认列名:
SELECT id, a, ordinality
FROM tbl, unnest(arr) WITH ORDINALITY a
还可以进一步简化:
SELECT * FROM tbl, unnest(arr) WITH ORDINALITY a
此最终形式返回 tbl
的所有列。当然,显式指定列别名和表限定列可以提高清晰度。
a
既用作表别名,也用作列别名(对于第一列),附加的序号列的默认名称为 ordinality
。
使用 row_number() OVER (PARTITION BY id ORDER BY elem)
根据排序顺序(而不是序号位置)获取数字:
SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t
虽然这通常有效,并且在简单的查询中没有观察到失败,但 PostgreSQL 不保证在没有 ORDER BY
的情况下行的顺序。当前行为是实现细节的结果。
要保证空格分隔字符串中元素的序号:
SELECT id, arr[nr] AS elem, nr
FROM (
SELECT *, generate_subscripts(arr, 1) AS nr
FROM (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
) sub
对于实际数组,可以使用更简单的版本:
SELECT id, arr[nr] AS elem, nr
FROM (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t
由于 PostgreSQL 8.1 到 8.4 版本缺少某些功能,例如 RETURNS TABLE
、generate_subscripts()
、unnest()
和 array_length()
,因此可以使用名为 f_unnest_ord
的自定义 SQL 函数:
CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) 1
FROM generate_series(array_lower($1,1), array_upper($1,1)) i'
修改后的函数如下:
CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) 1, i
FROM generate_series(array_lower($1,1), array_upper($1,1)) i'
此扩展函数 f_unnest_ord_idx
返回附加的 idx
列。比较:
SELECT id, arr, (rec).*
FROM (
SELECT *, f_unnest_ord_idx(arr) AS rec
FROM (
VALUES
(1, '{a,b,c}'::text[]) -- short for: '[1:3]={a,b,c}'
, (2, '[5:7]={a,b,c}')
, (3, '[-9:-7]={a,b,c}')
) t(id, arr)
) sub
输出
id | arr | val | ordinality | idx
---- ----------------- ----- ------------ -----
1 | {a,b,c} | a | 1 | 1
1 | {a,b,c} | b | 2 | 2
1 | {a,b,c} | c | 3 | 3
2 | [5:7]={a,b,c} | a | 1 | 5
2 | [5:7]={a,b,c} | b | 2 | 6
2 | [5:7]={a,b,c} | c | 3 | 7
3 | [-9:-7]={a,b,c} | a | 1 | -9
3 | [-9:-7]={a,b,c} | b | 2 | -8
3 | [-9:-7]={a,b,c} | c | 3 | -7
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3