Databend 优化器工作原理

核心概念

Databend 的查询优化器基于以下关键抽象构建，它们协同工作将 SQL 查询转换为高效执行计划：

┌─────────────────────────────────────────────────────────────────┐
│ 核心优化器组件                                                 │
├─────────────────┬───────────────────────────────────────────────┤
│ SExpr           │ 关系运算符的树形表示                           │
│ Pipeline        │ 优化阶段序列                                   │
│ Rules           │ 模式匹配转换规则                               │
│ Cost Model      │ 执行估算的数学模型                             │
└─────────────────┴───────────────────────────────────────────────┘

Databend 收集并使用以下统计信息指导优化决策：

表统计信息：

num_rows: 表行数
data_size: 表数据字节大小
number_of_blocks: 存储块数量
number_of_segments: 段数量

列统计信息：

min: 列最小值
max: 列最大值
null_count: 空值数量
number_of_distinct_values: 唯一值数量

优化管道

Databend 查询优化器遵循精心设计的管道将 SQL 查询转换为高效执行计划：

┌─────────────────────────────────────────────────────────────────┐
│                    优化器管道                                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 1. SubqueryDecorrelatorOptimizer                        │    │
│  │    将相关子查询转换为连接操作                           │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 2. RuleStatsAggregateOptimizer                          │    │
│  │    收集并传播表/列统计信息                              │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 3. CollectStatisticsOptimizer                           │    │
│  │    估算基数和选择性                                     │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 4. RuleNormalizeAggregateOptimizer                      │    │
│  │    简化复杂聚合操作                                     │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 5. PullUpFilterOptimizer                                │    │
│  │    在有益时合并并上移过滤器                             │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 6. RecursiveRuleOptimizer (DEFAULT_REWRITE_RULES)       │    │
│  │    应用标准转换规则                                     │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 7. RecursiveRuleOptimizer ([RuleID::SplitAggregate])    │    │
│  │    拆分聚合实现并行执行                                 │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 8. DPhpyOptimizer                                       │    │
│  │    使用动态规划寻找最优连接顺序                         │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 9. SingleToInnerOptimizer                               │    │
│  │    在可能时将半连接转换为内连接                         │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 10. DeduplicateJoinConditionOptimizer                   │    │
│  │     移除冗余连接条件                                    │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 11. CommuteJoin Rule (if join reordering enabled)       │    │
│  │     探索替代连接顺序                                    │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 12. CascadesOptimizer                                   │    │
│  │     选择最佳物理实现                                    │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                              │                                  │
│                              ▼                                  │
│  ┌─────────────────────────────────────────────────────────┐    │
│  │ 13. EliminateEvalScalar Rule (conditional)              │    │
│  │     消除冗余计算                                        │    │
│  └───────────────────────────┬─────────────────────────────┘    │
│                                                                 │
└───────────────────────────────┬─────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                     优化后的物理计划                             │
│                    准备高效执行                                 │
└─────────────────────────────────────────────────────────────────┘

优化管道实战

Databend 查询优化器通过四个阶段将 SQL 查询转换为高效执行计划：

查询准备与统计（步骤 1-3）

1. 子查询去相关（SubqueryDecorrelatorOptimizer）

SQL 示例：

SELECT * FROM customers c
WHERE c.total_orders > (SELECT AVG(total_orders) FROM customers WHERE region = c.region)

优化前：

Filter (c.total_orders > Subquery)
└─ Scan (customers as c)
   └─ Subquery: (correlated)
      └─ Aggregate (AVG(total_orders))
         └─ Filter (region = c.region)
            └─ Scan (customers)

优化后：

# 相关子查询转换为连接操作
Join (c.region = r.region)
├─ Scan (customers as c)
└─ Aggregate (region, AVG(total_orders) as avg_total)
   └─ Scan (customers)

# 子查询条件转为过滤条件
Filter (c.total_orders > r.avg_total)

作用： 将相关子查询转换为连接操作，从而显著提升执行速度。

2. 基于统计的聚合优化（RuleStatsAggregateOptimizer）

SQL 示例：

SELECT MIN(price) FROM products

优化前：

Aggregate (MIN(price))
└─ EvalScalar
   └─ Scan (products)

优化后：

# MIN 聚合替换为统计信息中的预计算值
EvalScalar (price_min)
└─ DummyTableScan

作用： 在可能时使用表统计信息中的常量值替换聚合函数（MIN/MAX），避免执行全表扫描。

3. 统计收集（CollectStatisticsOptimizer）

SQL 示例：

SELECT * FROM orders WHERE region = 'Asia'

优化前：

Filter (region = 'Asia')
└─ Scan (orders)
   [No statistics]

优化后：

Filter (region = 'Asia')
└─ Scan (orders)
   Statistics:  # 从存储层收集
   - table_stats: {num_rows, data_size, ...}
   - column_stats: {min, max, null_count, ndv}
   - histograms: {...}

作用： 从存储层收集实际统计信息并附加到扫描节点，必要时通过添加随机过滤器处理行级采样。

基于逻辑规则的优化（步骤 4-7）

4. 聚合规范化（RuleNormalizeAggregateOptimizer）

SQL 示例：

SELECT COUNT(id), COUNT(*), COUNT(DISTINCT region) FROM orders GROUP BY region

优化前：

Aggregate (
  GROUP BY [region],
  COUNT(id),
  COUNT(*),
  COUNT(DISTINCT region)
)
└─ Scan (orders)

优化后：

# 优化后的聚合
EvalScalar (COUNT(*) AS count_id, COUNT(*) AS count_star)
└─ Aggregate (
     GROUP BY [region],
     COUNT(*),
     COUNT()
   )
   └─ Scan (orders)

作用： 通过以下方式优化聚合函数：

将 COUNT(非空列) 重写为 COUNT(*)
复用单个 COUNT(*) 处理多个计数表达式
当计数列已包含在 GROUP BY 时消除 DISTINCT

5. 过滤器上提（PullUpFilterOptimizer）

SQL 示例：

SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id WHERE o.region = 'Asia' AND c.status = 'active'

优化前：

Filter (c.status = 'active')
└─ Filter (o.region = 'Asia')
   └─ Join (o.customer_id = c.id)
      ├─ Scan (orders as o)
      └─ Scan (customers as c)

优化后：

# 过滤器上提到顶部
Filter (o.region = 'Asia' AND c.status = 'active' AND o.customer_id = c.id)
└─ Join (Cross)
   ├─ Scan (orders as o)
   └─ Scan (customers as c)

作用： 将过滤条件从底层节点上提到计划树顶部，实现更全面的过滤优化。对于内连接，将连接条件转为过滤条件并转换为带过滤器的交叉连接。

6. 默认重写规则（RecursiveRuleOptimizer）

作用： 递归应用转换规则至查询计划，持续优化直至无法继续转换。

关键规则：

过滤器下推规则

SQL 示例：

SELECT * FROM orders WHERE region = 'Asia'

优化前：

Filter (region = 'Asia')
└─ Scan (orders)

优化后（PushDownFilterScan 规则）：

# 过滤器下推至扫描层
Scan (orders, pushdown_predicates=[region = 'Asia'])

作用： 将过滤器下推至存储层，跳过读取无关数据块。

LIMIT 下推规则

SQL 示例：

SELECT * FROM orders ORDER BY order_date LIMIT 10

优化前：

Limit (10)
└─ Sort (order_date)
   └─ Scan (orders)

优化后（PushDownLimitSort 规则）：

# LIMIT 穿透排序层下推
Sort (order_date)
└─ Limit (10)
   └─ Scan (orders)

作用： 将 LIMIT 子句下推以减少昂贵操作处理的数据量。

消除规则

SQL 示例：

SELECT * FROM orders WHERE 1=1

优化前：

Filter (1=1)
└─ Scan (orders)

优化后（EliminateFilter 规则）：

# 冗余过滤器已移除
Scan (orders)

作用： 消除冗余的过滤器、排序或投影操作符。

7. 聚合拆分（RecursiveRuleOptimizer - SplitAggregate）

SQL 示例：

SELECT region, SUM(amount) FROM orders GROUP BY region

优化前：

# 单阶段聚合（模式：Initial）
Aggregate (
  mode=Initial,
  groups=[region],
  aggregates=[SUM(amount)]
)
└─ Scan (orders)

优化后：

# 两阶段聚合
Aggregate (
  mode=Final,
  groups=[region],
  aggregates=[SUM(amount)]
)
└─ Aggregate (
     mode=Partial,
     groups=[region],
     aggregates=[SUM(amount)]
   )
   └─ Scan (orders)

作用： 将聚合拆分为 Partial（局部）和 Final（最终）两阶段，支持分布式执行。局部聚合在各节点执行，最终聚合合并结果，为并行处理提供基础。

连接策略优化（步骤 8-11）

8. 连接顺序优化（DPhpyOptimizer）

SQL 示例：

SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id JOIN products p ON o.product_id = p.id WHERE c.region = 'Asia'

优化前（原始顺序）：

Join
├─ Join
│  ├─ orders
│  └─ customers (region='Asia')
└─ products

优化后：

# 基于成本估算的优化连接顺序
Join
├─ Join
│  ├─ products
│  └─ customers (region='Asia')
└─ orders  # 大表移至外侧

作用： 基于表统计和连接条件，使用动态规划寻找最优连接顺序：

构建表间连接关系图
使用 DPhyp 算法枚举所有连接顺序
对多表查询自适应切换贪心算法
基于基数和选择性估算成本
选择最低成本方案

9. 单连接转内连接（SingleToInnerOptimizer）

SQL 示例：

SELECT o.* FROM orders o LEFT SINGLE JOIN customers c ON o.customer_id = c.id

优化前：

LeftSingleJoin (o.customer_id = c.id)
├─ Scan (orders as o)
└─ Scan (customers as c)

优化后：

# 单连接转为内连接
InnerJoin (o.customer_id = c.id)
├─ Scan (orders as o)
└─ Scan (customers as c)

作用： 当优化器标记 single_to_inner 标志时，将 LeftSingle/RightSingle 连接安全转换为内连接。

10. 连接条件去重（DeduplicateJoinConditionOptimizer）

SQL 示例：

SELECT * FROM t1, t2, t3 WHERE t1.id = t2.id AND t2.id = t3.id AND t3.id = t1.id

优化前：

Join (t2.id = t3.id AND t3.id = t1.id)
├─ Scan (t3)
└─ Join (t1.id = t2.id)
   ├─ Scan (t1)
   └─ Scan (t2)

优化后：

# 移除传递性连接条件
Join (t2.id = t3.id)
├─ Scan (t3)
└─ Join (t1.id = t2.id)
   ├─ Scan (t1)
   └─ Scan (t2)

作用： 使用并查集算法识别并移除冗余连接条件：

初始为每列创建等价组
处理连接条件时合并等价组
跳过已同组的条件
保留最小条件集

11. 连接交换（CommuteJoin Rule）

SQL 示例：

SELECT * FROM orders o JOIN customers c ON o.customer_id = c.id

优化前（orders 较大）：

Join (o.customer_id = c.id)
├─ Scan (orders as o)  # 大表（1000 万行）
└─ Scan (customers as c)  # 小表（10 万行）

优化后：

# 交换连接顺序使小表居左
Join (c.id = o.customer_id)
├─ Scan (customers as c)  # 小表移至左侧
└─ Scan (orders as o)  # 大表移至右侧

作用： 利用连接交换律优化物理执行：

比较左右输入基数
内连接中左侧行数较少时交换输入
相应调整连接类型（如 LEFT 转 RIGHT）

基于成本的物理计划选择（步骤 12）

12. 基于成本的实现选择（CascadesOptimizer）

SQL 示例：

SELECT customer_name, SUM(total_price) as total_spend
FROM customers JOIN orders ON customers.id = orders.customer_id
WHERE customers.region = 'Asia'
GROUP BY customer_name;

作用： 通过成本比较选择最优执行方案。

Cascades 工作原理：

┌───────────────────────────────────────────────────────────┐
│                   CASCADES 优化器                         │
├───────────────────────────────────────────────────────────┤
│                                                           │
│  1. 比较各操作的替代方案                                   │
│                                                           │
│     操作 A                 操作 B                         │
│     成本: 1000      vs.    成本: 100  ✓                   │
│                                                           │
│  2. 选择最低成本方案                                       │
│                                                           │
│  3. 构建最终执行计划                                       │
│                                                           │
└───────────────────────────────────────────────────────────┘

示例查询方案对比：

┌─────────────────────────────────────────────────────────┐
│ 操作                  │ 替代方案            │ 成本      │
├───────────────────────┼─────────────────────┼───────────┤
│ SCAN customers        │ FullTableScan       │ 1000      │
│ WHERE region='Asia'   │ FilterScan  ✓       │  100      │
├───────────────────────┼─────────────────────┼───────────┤
│ JOIN                  │ NestedLoopJoin      │ 2000      │
│                       │ HashJoin  ✓         │  500      │
├───────────────────────┼─────────────────────┼───────────┤
│ AGGREGATE             │ SortAggregate       │  800      │
│ GROUP BY customer_name│ HashAggregate  ✓    │  300      │
└───────────────────────┴─────────────────────┴───────────┘

成本计算模型：

┌───────────────────────────────────────────────────────────┐
│ 操作              │ 成本计算公式                          │
├───────────────────┼───────────────────────────────────────┤
│ Scan              │ group.stat_info.cardinality *         │
│                   │ compute_per_row                       │
├───────────────────┼───────────────────────────────────────┤
│ Join              │ build_card * hash_table_per_row +     │
│                   │ probe_card * compute_per_row          │
├───────────────────┼───────────────────────────────────────┤
│ Aggregate         │ card * aggregate_per_row              │
├───────────────────┼───────────────────────────────────────┤
│ Exchange (Hash)   │ cardinality * network_per_row +       │
│                   │ cardinality * compute_per_row         │
└───────────────────┴───────────────────────────────────────┘

成本因子默认值：

┌───────────────────────────────────────────────────────────┐
│ 成本因子            │ 默认值                              │
├─────────────────────┼─────────────────────────────────────┤
│ compute_per_row     │ 1                                   │
├─────────────────────┼─────────────────────────────────────┤
│ hash_table_per_row  │ 10                                  │
├─────────────────────┼─────────────────────────────────────┤
│ aggregate_per_row   │ 5                                   │
├─────────────────────┼─────────────────────────────────────┤
│ network_per_row     │ 50                                  │
└─────────────────────┴─────────────────────────────────────┘

注意： 成本因子与基数估算结合计算总成本，递归累计子操作成本后选择最低成本方案。

总结

Databend 查询优化器通过多阶段管道将 SQL 查询转换为高效物理计划：

准备阶段： 子查询去相关与统计收集
逻辑优化： 应用规则转换（过滤器下推/聚合规范化）
连接优化： 动态规划确定最优连接顺序
物理规划： 基于成本选择物理算子（如哈希连接 vs 嵌套循环连接）

通过系统化执行这些步骤，最小化资源消耗（CPU、内存、I/O）并最大化查询性能。

Databend 优化器工作原理

核心概念

优化管道

优化管道实战

查询准备与统计（步骤 1-3）

基于逻辑规则的优化（步骤 4-7）

过滤器下推规则

LIMIT 下推规则

消除规则

连接策略优化（步骤 8-11）

基于成本的物理计划选择（步骤 12）

总结

Join our growing community

GitHub

知乎

bilibili

开源中国

Explore Databend Cloud for FREE

核心概念​

优化管道​

优化管道实战​

查询准备与统计（步骤 1-3）​

基于逻辑规则的优化（步骤 4-7）​

过滤器下推规则​

LIMIT 下推规则​

消除规则​

连接策略优化（步骤 8-11）​

基于成本的物理计划选择（步骤 12）​

总结​

Join our growing community

GitHub

知乎

bilibili

开源中国

Explore Databend Cloud for FREE

核心概念

优化管道

优化管道实战

查询准备与统计（步骤 1-3）

基于逻辑规则的优化（步骤 4-7）

过滤器下推规则

LIMIT 下推规则

消除规则

连接策略优化（步骤 8-11）

基于成本的物理计划选择（步骤 12）

总结