聚合数据

学习如何使用 GROUP BY、聚合函数（Aggregate Function）和高级分组技术来汇总和分析数据。

基本聚合

常用聚合函数

-- 计算行数
SELECT COUNT(*) FROM employees;

-- 统计函数
SELECT 
    AVG(salary) as avg_salary,
    MIN(salary) as min_salary,
    MAX(salary) as max_salary,
    SUM(salary) as total_salary
FROM employees;

GROUP BY 基础

单列分组

-- 按部门统计员工人数
SELECT department, COUNT(*) as emp_count
FROM employees 
GROUP BY department;

-- 按部门计算平均薪资
SELECT department, AVG(salary) as avg_salary
FROM employees 
GROUP BY department
ORDER BY avg_salary DESC;

多列分组

-- 按部门和入职年份分组
SELECT 
    department,
    EXTRACT(YEAR FROM hire_date) as hire_year,
    COUNT(*) as count,
    AVG(salary) as avg_salary
FROM employees 
GROUP BY department, EXTRACT(YEAR FROM hire_date)
ORDER BY department, hire_year;

GROUP BY 与 HAVING

-- 查找员工人数超过 5 人的部门
SELECT department, COUNT(*) as emp_count
FROM employees 
GROUP BY department
HAVING COUNT(*) > 5;

-- 平均薪资大于 70000 的部门
SELECT department, AVG(salary) as avg_salary
FROM employees 
GROUP BY department
HAVING AVG(salary) > 70000;

高级分组

GROUP BY ALL

-- 自动按所有非聚合列进行分组
SELECT department, job_title, COUNT(*) as count
FROM employees 
GROUP BY ALL;

高级分组扩展

Databend 支持 SQL:2003 标准分组扩展：

ROLLUP - 分层小计
CUBE - 所有可能的组合
GROUPING SETS - 自定义组合

最佳实践

使用适当的聚合函数 - COUNT(*) 与 COUNT(column)
分组前过滤 - 在 GROUP BY 前使用 WHERE
使用 HAVING 进行聚合条件过滤 - 在聚合后过滤分组
考虑索引（Index） - GROUP BY 的列应当被索引

聚合数据

基本聚合

常用聚合函数

GROUP BY 基础

单列分组

多列分组

GROUP BY 与 HAVING

高级分组

GROUP BY ALL

高级分组扩展

最佳实践

加入我们的社区

GitHub

知乎

bilibili

开源中国

微信

销售电话

开始使用 Databend Cloud

基本聚合​

常用聚合函数​

GROUP BY 基础​

单列分组​

多列分组​

GROUP BY 与 HAVING​

高级分组​

GROUP BY ALL​

高级分组扩展​

最佳实践​

加入我们的社区

GitHub

知乎

bilibili

开源中国

微信

销售电话

开始使用 Databend Cloud

基本聚合

常用聚合函数

GROUP BY 基础

单列分组

多列分组

GROUP BY 与 HAVING

高级分组

GROUP BY ALL

高级分组扩展

最佳实践