跳到主要内容

数据类型

引入或更新于:v1.2.100

本页解释了数据类型的各个方面,包括数据类型列表、数据类型转换、转换方法以及 NULL 值和 NOT NULL 约束的处理。

数据类型列表

以下是 Databend 中的通用数据类型列表:

数据类型别名存储大小最小值最大值
BOOLEANBOOL1 字节N/AN/A
TINYINTINT81 字节-128127
SMALLINTINT162 字节-3276832767
INTINT324 字节-21474836482147483647
BIGINTINT648 字节-92233720368547758089223372036854775807
FLOATN/A4 字节-3.40282347e+383.40282347e+38
DOUBLEN/A8 字节-1.7976931348623157E+3081.7976931348623157E+308
DECIMALN/A16/32 字节-10^P / 10^S10^P / 10^S
DATEN/A4 字节1000-01-019999-12-31
TIMESTAMPN/A8 字节0001-01-01 00:00:009999-12-31 23:59:59.999999 UTC
VARCHARSTRINGN/AN/AN/A

以下是 Databend 中的半结构化数据类型列表:

数据类型别名示例描述
ARRAYN/A[1, 2, 3, 4]相同数据类型的值的集合,通过索引访问。
TUPLEN/A('2023-02-14','Valentine Day')不同数据类型的值的有序集合,通过索引访问。
MAPN/A{"a":1, "b":2, "c":3}一组键值对,其中每个键都是唯一的并映射到一个值。
VARIANTJSON[1,{"a":1,"b":{"c":2}}]不同数据类型的元素的集合,包括 ARRAYOBJECT
BITMAPN/A0101010101用于表示一组值的二进制数据类型,其中每个位表示一个值的存在或不存在。

数据类型转换

显式转换

我们有两种表达式可以将一个值转换为另一种数据类型。

  1. CAST 函数,如果在转换过程中发生错误,它会抛出错误。

我们还支持 pg 转换风格:CAST(c as INT)c::Int 相同。

  1. TRY_CAST 函数,如果在转换过程中发生错误,它返回 NULL。

隐式转换("强制转换")

关于 "强制转换"(即自动转换)的一些基本规则:

  1. 所有整数数据类型都可以隐式转换为 BIGINT 即 (INT64) 数据类型。

例如:

Int --> bigint
UInt8 --> bigint
Int32 --> bigint
  1. 所有数值数据类型都可以隐式转换为 Double 即 (Float64) 数据类型。

例如:

Int --> Double
Float --> Double
Int32 --> Double
  1. 所有非空数据类型 T 都可以隐式转换为 Nullable(T) 数据类型。

例如:

Int --> Nullable<Int>
String --> Nullable<String>
  1. 所有数据类型都可以隐式转换为 Variant 数据类型。

例如:

Int --> Variant
  1. 字符串数据类型是最低级别的数据类型,不能隐式转换为其他数据类型。
  2. Array<T> --> Array<U> 如果 T --> U
  3. Nullable<T> --> Nullable<U> 如果 T--> U
  4. Null --> Nullable<T> 对于任何 T 数据类型。
  5. 如果无损,数值可以隐式转换为其他数值数据类型。

常见问题

为什么数值类型不能自动转换为字符串类型。

这在其他流行的数据库中很常见,但它会引入歧义。

例如:

select 39 > '301';
select 39 = ' 39 ';

我们不知道是用数值规则还是字符串规则来比较它们。因为根据不同的规则,结果会不同。

select 39 > 301 是 false,而 select '39' > '301' 是 true。

为了使语法更精确且减少歧义,我们向用户抛出错误并要求更精确的 SQL。

为什么布尔类型不能自动转换为数值类型。

这也会带来歧义。 例如:

select true > 0.5;

错误信息 "can't cast from nullable data into non-nullable type" 是什么意思。

这意味着你的源列中有 NULL 值。你可以使用 TRY_CAST 函数或将目标类型设为可空类型。

select concat(1, col) 不起作用

你可以将 SQL 改进为 select concat('1', col)

我们可能会在未来改进表达式,以便在可能的情况下将字面量 1 解析为字符串值(concat 函数只接受字符串参数)。

NULL 值和 NOT NULL 约束

NULL 值用于表示不存在或未知的数据。在 Databend 中,每个列默认都可以包含 NULL 值,这意味着列可以同时容纳 NULL 值和常规数据。

如果你需要一个不允许 NULL 值的列,请使用 NOT NULL 约束。如果在 Databend 中将列配置为不允许 NULL 值,并且在插入数据时没有显式提供该列的值,则将自动应用与该列数据类型关联的默认值。

数据类型默认值
整数数据类型0
浮点数据类型0.0
字符和字符串空字符串 ('')
日期和时间数据类型'1970-01-01' 对于 DATE, '1970-01-01 00:00:00' 对于 TIMESTAMP
布尔数据类型False

例如,如果你创建如下表:

CREATE TABLE test(
id Int64,
name String NOT NULL,
age Int32
);

DESC test;

Field|Type |Null|Default|Extra|
-----+-------+----+-------+-----+
id |BIGINT |YES |NULL | |
name |VARCHAR|NO |'' | |
age |INT |YES |NULL | |
  • "id" 列可以包含 NULL 值,因为它没有 "NOT NULL" 约束。这意味着它可以存储整数或留空以表示缺失的数据。

  • "name" 列必须始终有一个值,因为它有 "NOT NULL" 约束,不允许 NULL 值。

  • "age" 列与 "id" 列一样,也可以包含 NULL 值,因为它没有 "NOT NULL" 约束,允许空条目或 NULL 值来表示未知的年龄。

以下 INSERT 语句插入一行,其中 "age" 列的值为 NULL。这是允许的,因为 "age" 列没有 NOT NULL 约束,因此它可以包含 NULL 值以表示缺失或未知的数据。

INSERT INTO test (id, name, age) VALUES (2, 'Alice', NULL);

以下 INSERT 语句向 "test" 表插入一行,其中 "id" 和 "name" 列有值,但没有为 "age" 列提供值。这是允许的,因为 "age" 列没有 NOT NULL 约束,因此可以留空或分配 NULL 值以表示缺失或未知的数据。

INSERT INTO test (id, name) VALUES (1, 'John');

以下 INSERT 语句尝试插入一行,但没有为 "name" 列提供值。将应用列类型的默认值。

INSERT INTO test (id, age) VALUES (3, 45);