Variant
VARIANT 可以存储任意类型的值,包括 NULL、BOOLEAN、NUMBER、STRING、ARRAY 和 OBJECT。其内部值可以是任意层级的嵌套结构,这使得存储各种数据非常灵活。VARIANT 通常也被称为 JSON,更多信息请参考 JSON 官网。
以下是在 Databend 中插入和查询 Variant 数据的示例:
创建表:
CREATE TABLE customer_orders(id INT64, order_data VARIANT);
插入包含不同类型值的记录:
INSERT INTO
customer_orders
VALUES
(
1,
'{"customer_id": 123, "order_id": 1001, "items": [{"name": "Shoes", "price": 59.99}, {"name": "T-shirt", "price": 19.99}]}'
),
(
2,
'{"customer_id": 456, "order_id": 1002, "items": [{"name": "Backpack", "price": 79.99}, {"name": "Socks", "price": 4.99}]}'
),
(
3,
'{"customer_id": 123, "order_id": 1003, "items": [{"name": "Shoes", "price": 59.99}, {"name": "Socks", "price": 4.99}]}'
);
查询结果:
SELECT * FROM customer_orders;
结果:
┌─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ id │ order_data │
├─────────────────┼───────────────────────────────────────────────────────────────────────────────────────────────────────────────┤
│ 1 │ {"customer_id":123,"items":[{"name":"Shoes","price":59.99},{"name":"T-shirt","price":19.99}],"order_id":1001} │
│ 2 │ {"customer_id":456,"items":[{"name":"Backpack","price":79.99},{"name":"Socks","price":4.99}],"order_id":1002} │
│ 3 │ {"customer_id":123,"items":[{"name":"Shoes","price":59.99},{"name":"Socks","price":4.99}],"order_id":1003} │
└─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
访问 JSON 元素
通过索引访问
VARIANT 类型可以包含数组,与许多编程语言一样,索引从 0 开始。数组中的每个元素也是 VARIANT 类型。可以使用方括号通过索引来访问元素。
示例
创建表:
-- 创建一个表来存储用户的爱好
CREATE TABLE user_hobbies(user_id INT64, hobbies VARIANT NULL);
插入示例数据:
INSERT INTO user_hobbies
VALUES
(1, '["Cooking", "Reading", "Cycling"]'),
(2, '["Photography", "Travel", "Swimming"]');
获取每个用户的第一个爱好:
SELECT
user_id,
hobbies [0] AS first_hobby
FROM
user_hobbies;
结果:
┌─────────────────────────────────────┐
│ user_id │ first_hobby │
├─────────────────┼───────────────────┤
│ 1 │ "Cooking" │
│ 2 │ "Photography" │
└─────────────────────────────────────┘
获取每个用户的第三个爱好:
SELECT
hobbies [2],
count() AS third_hobby
FROM
user_hobbies
GROUP BY
hobbies [2];
结果:
┌─────────────────────────────────┐
│ hobbies[2] │ third_hobby │
├───────────────────┼─────────────┤
│ "Swimming" │ 1 │
│ "Cycling" │ 1 │
└─────────────────────────────────┘
使用 GROUP BY 获取爱好:
SELECT
hobbies [2],
count() AS third_hobby
FROM
user_hobbies
GROUP BY
hobbies [2];
结果:
┌────────────┬─────────────┐
│ hobbies[2] │ third_hobby │
├────────────┼─────────────┤
│ "Cycling" │ 1 │
│ "Swimming" │ 1 │
└────────────┴─────────────┘
通过字段名访问
VARIANT 类型包含表示为对象的键值对,其中每个键都是 VARCHAR,每个值都是 VARIANT。其功能类似于其他编程语言中的“字典”、“哈希”或“Map”。可以通过方括号或冒号按字段名访问值。对于二级及更深层级,还可以使用点号(点号不能用于一级名称,以避免与表名和列名之间的点号混淆)。
示例
创建一个表来存储 VARIANT 类型的用户偏好设置:
CREATE TABLE user_preferences(
user_id INT64,
preferences VARIANT NULL,
profile Tuple(name STRING, age INT)
);
插入示例数据:
INSERT INTO
user_preferences
VALUES
(
1,
'{"settings":{"color":"red", "fontSize":16, "theme":"dark"}}',
('Amy', 12)
),
(
2,
'{"settings":{"color":"blue", "fontSize":14, "theme":"light"}}',
('Bob', 11)
);
获取每个用户的首选颜色:
SELECT
preferences['settings']['color'],
preferences['settings']:color,
preferences['settings'].color,
preferences:settings['color'],
preferences:settings:color,
preferences:settings.color
FROM
user_preferences;
结果:
┌────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ preferences['settings']['color'] │ preferences['settings']:color │ preferences['settings']:color │ preferences:settings['color'] │ preferences:settings:color │ preferences:settings:color │
├──────────────────────────────────┼───────────────────────────────┼───────────────────────────────┼───────────────────────────────┼────────────────────────────┼────────────────────────────┤
│ "red" │ "red" │ "red" │ "red" │ "red" │ "red" │
│ "blue" │ "blue" │ "blue" │ "blue" │ "blue" │ "blue" │
└────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
请注意,字段名区分大小写。如果字段名包含空格或特殊字符,请将其括在双引号中。
INSERT INTO
user_preferences
VALUES
(
3,
'{"new settings":{"color":"red", "fontSize":16, "theme":"dark"}}',
('Cole', 13)
);
-- 使用双引号括起字段名 "new settings"
SELECT preferences:"new settings":color
FROM user_preferences;
┌──────────────────────────────────┐
│ preferences:"new settings":color │
├──────────────────────────────────┤
│ NULL │
│ NULL │
│ "red" │
└──────────────────────────────────┘
-- 当 'color' 中的 'c' 大写时,不返回任何结果
SELECT preferences:"new settings":Color
FROM user_preferences;
┌──────────────────────────────────┐
│ preferences:"new settings":color │
│ Nullable(Variant) │
├──────────────────────────────────┤
│ NULL │
│ NULL │
│ NULL │
└──────────────────────────────────┘
数据类型转换
默认情况下,从 VARIANT 列检索到的元素以原始形式返回。要将其转换为特定类型,请使用 :: 运算符加上目标数据类型(例如 expression::type)。
创建一个表来存储具有 VARIANT 列的用户偏好设置:
CREATE TABLE user_pref(user_id INT64, pref VARIANT NULL);
插入示例数据:
INSERT INTO user_pref
VALUES
(1, parse_json('{"age": 25, "isPremium": "true", "lastActive": "2023-04-10"}')),
(2, parse_json('{"age": 30, "isPremium": "false", "lastActive": "2023-03-15"}'));
将 age 转换为 INT64:
SELECT user_id, pref:age::INT64 as age FROM user_pref;
结果:
┌─────────┬─────┐
│ user_id │ age │
├─────────┼─────┤
│ 1 │ 25 │
│ 2 │ 30 │
└─────────┴─────┘
JSON 函数
请参阅 Variant Functions。

