FLATTEN
Introduced or updated: v1.2.213
将嵌套的 JSON 或数组数据转换为表格格式,其中每个元素或字段都表示为单独的行。
语法
[LATERAL] FLATTEN (
INPUT => <expr>
[, PATH => <expr>]
[, OUTER => TRUE | FALSE]
[, RECURSIVE => TRUE | FALSE]
[, MODE => 'OBJECT' | 'ARRAY' | 'BOTH']
)
参数
参数 | 描述 | 默认值 |
---|---|---|
INPUT | 要扁平化的 JSON 或数组数据 | 必需 |
PATH | 要扁平化的数组/对象的路径 | None |
OUTER | 包含零结果的行(带有 NULL 值) | FALSE |
RECURSIVE | 扁平化嵌套元素 | FALSE |
MODE | 扁平化对象、数组或两者 | 'BOTH' |
LATERAL | 允许与前面的表表达式交叉引用 | 可选 |
输出列
列 | 描述 |
---|---|
SEQ | 输入的序列号 |
KEY | 展开值的键(如果没有则为 NULL) |
PATH | 扁平化元素的路径 |
INDEX | 数组索引(对象为 NULL) |
VALUE | 扁平化元素的值 |
THIS | 正在扁平化的元素 |
注意: 使用 LATERAL 时,由于动态交叉引用,输出列可能会有所不同。
示例
基本扁平化
-- 扁平化具有嵌套结构的 JSON 对象
SELECT * FROM FLATTEN(
INPUT => PARSE_JSON(
'{"name": "John", "languages": ["English", "Spanish"], "address": {"city": "New York"}}'
)
);
结果是最顶层的键被扁平化:
| seq | key | path | index | value | this |
|-----|-----------|-----------|-------|----------------------|----------------------|
| 1 | name | name | NULL | "John" | {original JSON} |
| 1 | languages | languages | NULL | ["English","Spanish"]| {original JSON} |
| 1 | address | address | NULL | {"city":"New York"} | {original JSON} |
使用 PATH 参数
-- 通过指定 PATH 仅扁平化 languages 数组
SELECT * FROM FLATTEN(
INPUT => PARSE_JSON(
'{"name": "John", "languages": ["English", "Spanish"]}'
),
PATH => 'languages'
);
结果是数组元素被扁平化:
| seq | key | path | index | value | this |
|-----|------|--------------|-------|-----------|-------------------|
| 1 | NULL | languages[0] | 0 | "English" | ["English","Spanish"] |
| 1 | NULL | languages[1] | 1 | "Spanish" | ["English","Spanish"] |
递归扁平化
-- 递归扁平化嵌套对象和数组
SELECT * FROM FLATTEN(
INPUT => PARSE_JSON(
'{"name": "John", "address": {"city": "New York", "zip": 10001}}'
),
RECURSIVE => TRUE
);
结果是嵌套对象被扁平化:
| seq | key | path | index | value | this |
|-----|---------|--------------|-------|-------------|-----------------|
| 1 | name | name | NULL | "John" | {original JSON} |
| 1 | address | address | NULL | {"city":...}| {original JSON} |
| 1 | city | address.city | NULL | "New York" | {"city":...} |
| 1 | zip | address.zip | NULL | 10001 | {"city":...} |
使用 LATERAL FLATTEN
-- 使用 LATERAL FLATTEN 将 JSON 数组转换为行
-- 这允许直接访问数组元素,而无需表
SELECT
f.value:item::STRING AS item_name,
f.value:price::FLOAT AS price
FROM
LATERAL FLATTEN(
INPUT => PARSE_JSON('[
{"item":"coffee", "price":2.50},
{"item":"donut", "price":1.20}
]')
) f;
结果:
| item_name | price |
|-----------|-------|
| coffee | 2.5 |
| donut | 1.2 |