跳到主要内容

INSERT

将一行或多行插入到表中。

原子操作

Databend 通过原子操作确保数据完整性。插入、更新、替换和删除操作要么完全成功,要么完全失败。

另请参阅:INSERT (多表)

语法

INSERT { OVERWRITE | INTO } <table>
-- 可选地指定要插入的列
( <column> [ , ... ] )
-- 插入选项:
{
-- 直接插入值或默认值
VALUES ( <value> | DEFAULT ) [ , ... ] |
-- 插入查询结果
SELECT ...
}
参数描述
OVERWRITE指示在插入之前是否应截断现有数据。
VALUES允许直接插入特定值或列的默认值。

示例

示例-1:使用 OVERWRITE 插入值

在此示例中,使用 INSERT OVERWRITE 语句截断 employee 表并插入新数据,用提供的值替换所有现有记录,为 ID 为 100 的员工插入新数据。

CREATE TABLE employee (
employee_id INT,
employee_name VARCHAR(50)
);

-- 向 employee 表插入初始数据
INSERT INTO employee(employee_id, employee_name) VALUES
(101, 'John Doe'),
(102, 'Jane Smith');

-- 使用 OVERWRITE 插入新数据
INSERT OVERWRITE employee VALUES (100, 'John Johnson');

-- 显示 employee 表的内容
SELECT * FROM employee;

┌────────────────────────────────────┐
│ employee_id │ employee_name │
├─────────────────┼──────────────────┤
100 │ John Johnson │
└────────────────────────────────────┘

示例-2:插入查询结果

当插入 SELECT 语句的结果时,列的映射遵循它们在 SELECT 子句中的位置。因此,SELECT 语句中的列数必须等于或大于 INSERT 表中的列数。在 SELECT 语句和 INSERT 表中的列数据类型不同的情况下,将根据需要进行类型转换。

-- 创建一个名为 'employee_info' 的表,包含三列:'employee_id'、'employee_name' 和 'department'
CREATE TABLE employee_info (
employee_id INT,
employee_name VARCHAR(50),
department VARCHAR(50)
);

-- 向 'employee_info' 表插入一条记录
INSERT INTO employee_info VALUES ('101', 'John Doe', 'Marketing');

-- 创建一个名为 'employee_data' 的表,包含三列:'ID'、'Name' 和 'Dept'
CREATE TABLE employee_data (
ID INT,
Name VARCHAR(50),
Dept VARCHAR(50)
);

-- 将 'employee_info' 中的数据插入到 'employee_data' 中
INSERT INTO employee_data SELECT * FROM employee_info;

-- 显示 'employee_data' 表的内容
SELECT * FROM employee_data;

┌───────────────────────────────────────────────────────┐
│ id │ name │ dept │
├─────────────────┼──────────────────┼──────────────────┤
101 │ John Doe │ Marketing │
└───────────────────────────────────────────────────────┘

此示例演示创建一个名为 "sales_summary" 的汇总表,用于存储聚合的销售数据,例如每个产品的总销售数量和收入,通过从销售表中聚合信息:

-- 创建一个用于销售数据的表
CREATE TABLE sales (
product_id INT,
quantity_sold INT,
revenue DECIMAL(10, 2)
);

-- 插入一些示例销售数据
INSERT INTO sales (product_id, quantity_sold, revenue) VALUES
(1, 100, 500.00),
(2, 150, 750.00),
(1, 200, 1000.00),
(3, 50, 250.00);

-- 创建一个汇总表以存储聚合的销售数据
CREATE TABLE sales_summary (
product_id INT,
total_quantity_sold INT,
total_revenue DECIMAL(10, 2)
);

-- 将聚合的销售数据插入到汇总表中
INSERT INTO sales_summary (product_id, total_quantity_sold, total_revenue)
SELECT
product_id,
SUM(quantity_sold) AS total_quantity_sold,
SUM(revenue) AS total_revenue
FROM
sales
GROUP BY
product_id;

-- 显示 sales_summary 表的内容
SELECT * FROM sales_summary;

┌──────────────────────────────────────────────────────────────────┐
│ product_id │ total_quantity_sold │ total_revenue │
├─────────────────┼─────────────────────┼──────────────────────────┤
13001500.00
350250.00
2150750.00
└──────────────────────────────────────────────────────────────────┘

示例-3:插入默认值

此示例说明创建一个名为 "staff_records" 的表,并为 department 和 status 等列设置默认值。然后插入数据,展示默认值的使用。

-- 创建一个表 'staff_records',包含列 'employee_id'、'department'、'salary' 和 'status',并设置默认值
CREATE TABLE staff_records (
employee_id INT NULL,
department VARCHAR(50) DEFAULT 'HR',
salary FLOAT,
status VARCHAR(10) DEFAULT 'Active'
);

-- 向 'staff_records' 插入数据,使用默认值
INSERT INTO staff_records
VALUES
(DEFAULT, DEFAULT, DEFAULT, DEFAULT),
(101, DEFAULT, 50000.00, DEFAULT),
(102, 'Finance', 60000.00, 'Inactive'),
(103, 'Marketing', 70000.00, 'Active');

-- 显示 'staff_records' 表的内容
SELECT * FROM staff_records;

┌───────────────────────────────────────────────────────────────────────────┐
│ employee_id │ department │ salary │ status
├─────────────────┼──────────────────┼───────────────────┼──────────────────┤
NULL │ HR │ NULL │ Active │
101 │ HR │ 50000 │ Active │
102 │ Finance │ 60000 │ Inactive │
103 │ Marketing │ 70000 │ Active │
└───────────────────────────────────────────────────────────────────────────┘

示例-4:使用 Staged 文件插入

Databend 允许您使用 INSERT INTO 语句从 staged 文件中将数据插入到表中。这是通过 Databend 的 查询 Staged 文件 功能实现的,然后将查询结果插入到表中。

  1. 创建一个名为 sample 的表:
CREATE TABLE sample
(
id INT,
city VARCHAR,
score INT,
country VARCHAR DEFAULT 'China'
);
  1. 设置一个包含示例数据的内部 stage

我们将创建一个名为 mystage 的内部 stage,然后填充示例数据。

CREATE STAGE mystage;

COPY INTO @mystage
FROM
(
SELECT *
FROM
(
VALUES
(1, 'Chengdu', 80),
(3, 'Chongqing', 90),
(6, 'Hangzhou', 92),
(9, 'Hong Kong', 88)
)
)
FILE_FORMAT = (TYPE = PARQUET);
  1. 使用 INSERT INTO 从 staged Parquet 文件插入数据
提示

您可以使用 COPY INTO 命令中的 FILE_FORMAT 和 COPY_OPTIONS 指定文件格式和各种复制相关设置。当 purge 设置为 true 时,只有在数据更新成功时才会删除原始文件。

INSERT INTO sample 
(id, city, score)
ON
(Id)
SELECT
$1, $2, $3
FROM
@mystage
(FILE_FORMAT => 'parquet');
  1. 验证数据插入
SELECT * FROM sample;

结果应为:

┌─────────────────────────────────────────────────────────────────────────┐
│ id │ city │ score │ country │
├─────────────────┼──────────────────┼─────────────────┼──────────────────┤
1 │ Chengdu │ 80 │ China │
3 │ Chongqing │ 90 │ China │
6 │ Hangzhou │ 92 │ China │
9 │ Hong Kong │ 88 │ China │
└─────────────────────────────────────────────────────────────────────────┘