跳到主要内容

GROUP BY

Introduced or updated: v1.2.32

GROUP BY 子句使您能够基于相同的 group-by-item 表达式对行进行分组,然后对每个结果分组应用聚合函数。group-by-item 表达式可以包括列名或别名、SELECT 列表中位置的数值引用、一般表达式,或 SELECT 列表中所有非聚合项。

Databend 中的 GROUP BY 子句具有以下扩展,以实现更全面的数据分组和多样化的数据分析:

语法

SELECT ...
FROM ...
[ ... ]
GROUP BY [ ALL | groupItem [ , groupItem [ , ... ] ] ]
[ ... ]

其中:

  • ALL:当使用关键字 "ALL" 时,Databend 会根据 SELECT 列表中所有非聚合项对数据进行分组。
  • groupItem:分组项可以是以下之一:
    • 在 SELECT 列表中定义的列名或别名。
    • SELECT 列表中列位置的数值引用。
    • 涉及当前查询上下文中使用的表的列的任何表达式。

示例

本节中的 GROUP BY 示例建立在以下数据设置之上:

-- 创建一个名为 "employees" 的示例表
CREATE TABLE employees (
id INT,
first_name VARCHAR(50),
last_name VARCHAR(50),
department_id INT,
job_id INT,
hire_date DATE
);

-- 向 "employees" 表中插入示例数据
INSERT INTO employees (id, first_name, last_name, department_id, job_id, hire_date)
VALUES (1, 'John', 'Doe', 1, 101, '2021-01-15'),
(2, 'Jane', 'Smith', 1, 101, '2021-02-20'),
(3, 'Alice', 'Johnson', 1, 102, '2021-03-10'),
(4, 'Bob', 'Brown', 2, 201, '2021-03-15'),
(5, 'Charlie', 'Miller', 2, 202, '2021-04-10'),
(6, 'Eve', 'Davis', 2, 202, '2021-04-15');

按单一列分组

此查询按 department_id 对员工进行分组,并计算每个部门的员工数量:

SELECT department_id, COUNT(*) AS num_employees
FROM employees
GROUP BY department_id;

输出:

+---------------+---------------+
| department_id | num_employees |
+---------------+---------------+
| 1 | 3 |
| 2 | 3 |
+---------------+---------------+

按多列分组

此查询按 department_idjob_id 对员工进行分组,然后计算每个组中的员工数量:

SELECT department_id, job_id, COUNT(*) AS num_employees
FROM employees
GROUP BY department_id, job_id;

输出:

+---------------+--------+---------------+
| department_id | job_id | num_employees |
+---------------+--------+---------------+
| 1 | 101 | 2 |
| 1 | 102 | 1 |
| 2 | 201 | 1 |
| 2 | 202 | 2 |
+---------------+--------+---------------+

按 ALL 分组

此查询使用 GROUP BY ALL 子句对员工进行分组,该子句按 SELECT 列表中所有非聚合列进行分组。请注意,在这种情况下,结果将与按 department_idjob_id 分组相同,因为这些是 SELECT 列表中唯一存在的非聚合项。

SELECT department_id, job_id, COUNT(*) AS num_employees
FROM employees
GROUP BY ALL;

输出:

+---------------+--------+---------------+
| department_id | job_id | num_employees |
+---------------+--------+---------------+
| 1 | 101 | 2 |
| 1 | 102 | 1 |
| 2 | 201 | 1 |
| 2 | 202 | 2 |
+---------------+--------+---------------+

按位置分组

此查询等同于上面的“按单一列分组”示例。位置 1 指的是 SELECT 列表中的第一个项,即 department_id

SELECT department_id, COUNT(*) AS num_employees
FROM employees
GROUP BY 1;

输出:

+---------------+---------------+
| department_id | num_employees |
+---------------+---------------+
| 1 | 3 |
| 2 | 3 |
+---------------+---------------+

按表达式分组

此查询按员工被雇用的年份分组,并计算每年雇用的员工数量:

SELECT EXTRACT(YEAR FROM hire_date) AS hire_year, COUNT(*) AS num_hires
FROM employees
GROUP BY EXTRACT(YEAR FROM hire_date);

输出:

+-----------+-----------+
| hire_year | num_hires |
+-----------+-----------+
| 2021 | 6 |
+-----------+-----------+
这篇文章对您有帮助吗?
Yes
No
开始使用 Databend Cloud
低成本
快速分析
多种数据源
弹性扩展
注册