INSERT
将一行或多行插入到表中。
原子操作
Databend 通过原子操作确保数据完整性。插入、更新、替换和删除操作要么完全成功,要么完全失败。
另请参阅:INSERT (多表)
语法
INSERT { OVERWRITE | INTO } <table>
-- 可选地指定要插入的列
( <column> [ , ... ] )
-- 插入选项:
{
-- 直接插入值或默认值
VALUES ( <value> | DEFAULT ) [ , ... ] |
-- 插入查询结果
SELECT ...
}
参数 | 描述 |
---|---|
OVERWRITE | 指示在插入之前是否应截断现有数据。 |
VALUES | 允许直接插入特定值或列的默认值。 |
示例
示例-1:使用 OVERWRITE 插入值
在此示例中,使用 INSERT OVERWRITE 语句截断 employee 表并插入新数据,用提供的值替换所有现有记录,为 ID 为 100 的员工插入新数据。
CREATE TABLE employee (
employee_id INT,
employee_name VARCHAR(50)
);
-- 向 employee 表插入初始数据
INSERT INTO employee(employee_id, employee_name) VALUES
(101, 'John Doe'),
(102, 'Jane Smith');
-- 使用 OVERWRITE 插入新数据
INSERT OVERWRITE employee VALUES (100, 'John Johnson');
-- 显示 employee 表的内容
SELECT * FROM employee;
┌───────────────────────── ───────────┐
│ employee_id │ employee_name │
├─────────────────┼──────────────────┤
│ 100 │ John Johnson │
└────────────────────────────────────┘
示例-2:插入查询结果
当插入 SELECT 语句的结果时,列的映射遵循它们在 SELECT 子句中的位置。因此,SELECT 语句中的列数必须等于或大于 INSERT 表中的列数。在 SELECT 语句和 INSERT 表中的列数据类型不同的情况下,将根据需要进行类型转换。
-- 创建一个名为 'employee_info' 的表,包含三列:'employee_id'、'employee_name' 和 'department'
CREATE TABLE employee_info (
employee_id INT,
employee_name VARCHAR(50),
department VARCHAR(50)
);
-- 向 'employee_info' 表插入一条记录
INSERT INTO employee_info VALUES ('101', 'John Doe', 'Marketing');
-- 创建一个名为 'employee_data' 的表,包含三列:'ID'、'Name' 和 'Dept'
CREATE TABLE employee_data (
ID INT,
Name VARCHAR(50),
Dept VARCHAR(50)
);
-- 将 'employee_info' 中的数据插入到 'employee_data' 中
INSERT INTO employee_data SELECT * FROM employee_info;
-- 显示 'employee_data' 表的内容
SELECT * FROM employee_data;
┌───────────────────────────────────────────────────────┐
│ id │ name │ dept │
├─────────────────┼──────────────────┼──────────────────┤
│ 101 │ John Doe │ Marketing │
└───────────────────────────────────────────────────────┘
此示例演示创建一个名为 "sales_summary" 的汇总表,用于存储聚合的销售数据,例如每个产品的总销售数量和收入,通过从销售表中聚合信息:
-- 创建一个用于销售数据的表
CREATE TABLE sales (
product_id INT,
quantity_sold INT,
revenue DECIMAL(10, 2)
);
-- 插入一些示例销售数据
INSERT INTO sales (product_id, quantity_sold, revenue) VALUES
(1, 100, 500.00),
(2, 150, 750.00),
(1, 200, 1000.00),
(3, 50, 250.00);
-- 创建一个汇总表以存储聚合的销售数据
CREATE TABLE sales_summary (
product_id INT,
total_quantity_sold INT,
total_revenue DECIMAL(10, 2)
);
-- 将聚合的销售数据插入到汇总表中
INSERT INTO sales_summary (product_id, total_quantity_sold, total_revenue)
SELECT
product_id,
SUM(quantity_sold) AS total_quantity_sold,
SUM(revenue) AS total_revenue
FROM
sales
GROUP BY
product_id;
-- 显示 sales_summary 表的内容
SELECT * FROM sales_summary;
┌──────────────────────────────────────────────────────────────────┐
│ product_id │ total_quantity_sold │ total_revenue │
├─────────────────┼─────────────────────┼──────────────────────────┤
│ 1 │ 300 │ 1500.00 │
│ 3 │ 50 │ 250.00 │
│ 2 │ 150 │ 750.00 │
└──────────────────────────────────────────────────────────────────┘
示例-3:插入默认值
此示例说明创建一个名为 "staff_records" 的表,并为 department 和 status 等列设置默认值。然后插入数据,展示默认值的使用。
-- 创建一个表 'staff_records',包含列 'employee_id'、'department'、'salary' 和 'status',并设置默认值
CREATE TABLE staff_records (
employee_id INT NULL,
department VARCHAR(50) DEFAULT 'HR',
salary FLOAT,
status VARCHAR(10) DEFAULT 'Active'
);
-- 向 'staff_records' 插入数据,使用默认值
INSERT INTO staff_records
VALUES
(DEFAULT, DEFAULT, DEFAULT, DEFAULT),
(101, DEFAULT, 50000.00, DEFAULT),
(102, 'Finance', 60000.00, 'Inactive'),
(103, 'Marketing', 70000.00, 'Active');
-- 显示 'staff_records' 表的内容
SELECT * FROM staff_records;
┌───────────────────────────────────────────────────────────────────────────┐
│ employee_id │ department │ salary │ status │
├─────────────────┼──────────────────┼───────────────────┼──────────────────┤
│ NULL │ HR │ NULL │ Active │
│ 101 │ HR │ 50000 │ Active │
│ 102 │ Finance │ 60000 │ Inactive │
│ 103 │ Marketing │ 70000 │ Active │
└───────────────────────────────────────────────────────────────────────────┘
示例-4:使用 Staged 文件插入
Databend 允许您使用 INSERT INTO 语句从 staged 文件中将数据插入到表中。这是通过 Databend 的 查询 Staged 文件 功能实现的,然后将查询结果插入到表中。
- 创建一个名为
sample
的表:
CREATE TABLE sample
(
id INT,
city VARCHAR,
score INT,
country VARCHAR DEFAULT 'China'
);
- 设置一个包含示例数据的内部 stage
我们将创建一个名为 mystage
的内部 stage,然后填充示例数据。
CREATE STAGE mystage;
COPY INTO @mystage
FROM
(
SELECT *
FROM
(
VALUES
(1, 'Chengdu', 80),
(3, 'Chongqing', 90),
(6, 'Hangzhou', 92),
(9, 'Hong Kong', 88)
)
)
FILE_FORMAT = (TYPE = PARQUET);
- 使用
INSERT INTO
从 staged Parquet 文件插入数据
提示
您可以使用 COPY INTO 命令中的 FILE_FORMAT 和 COPY_OPTIONS 指定文件格式和各种复制相关设置。当 purge
设置为 true
时,只有在数据更新成功时才会删除原始文件。
INSERT INTO sample
(id, city, score)
ON
(Id)
SELECT
$1, $2, $3
FROM
@mystage
(FILE_FORMAT => 'parquet');
- 验证数据插入
SELECT * FROM sample;
结果应为:
┌─────────────────────────────────────────────────────────────────────────┐
│ id │ city │ score │ country │
├─────────────────┼──────────────────┼─────────────────┼──────────────────┤
│ 1 │ Chengdu │ 80 │ China │
│ 3 │ Chongqing │ 90 │ China │
│ 6 │ Hangzhou │ 92 │ China │
│ 9 │ Hong Kong │ 88 │ China │
└─────────────────────────────────────────────────────────────────────────┘