跳到主要内容

查询概要

查询概要指的是特定 SQL 语句执行过程的图形表示或可视化分解。它本质上是一个图形版本的 EXPLAIN 命令,提供了查询执行计划和性能细节的洞察。

访问查询概要

查询概要可以直接在 Databend Cloud 中访问。要查看查询的查询概要,请前往 监控 > SQL 历史记录。从历史列表中选择一个 SQL 语句,然后点击 查询概要 标签。如果你使用的是自托管的 Databend,你可以使用 EXPLAIN 命令作为替代。

查询概要包含的内容

以下是一个查询概要的示例,由一组三个操作符节点组成,呈层次结构。在执行 SQL 语句时,Databend Cloud 按自底向上的顺序处理这些节点。查询概要包含的操作符节点的数量和类型取决于你的 SQL 语句的具体情况。对于常见的操作符及其统计字段,请参见 常见操作符与字段

alt text

请注意,每个节点标题中的括号数字代表节点 ID,并不表示执行步骤。

查询概要附带一组信息窗格,提供更多详细信息。上面的示例包括两个信息窗格:

窗格描述
最耗时的节点列出执行时间最长的节点。
概要总览显示在 CPU 和 I/O 上花费的时间百分比。请注意,如果你选择一个节点,此信息窗格将显示你选择的节点的特定信息,而不是整个查询的信息。

如果你点击 TableScan [4] 节点,你会注意到右侧添加了两个额外的信息窗格:

alt text

窗格描述
统计信息包括扫描进度、扫描的字节数、从缓存中扫描的百分比、扫描的分区等信息。
属性显示节点的特定详细信息。显示的字段根据节点的功能而有所不同。

常见操作符与字段

解释计划包括各种操作符,具体取决于你希望 Databend 解释的 SQL 语句。以下是常见操作符及其字段的列表:

  • TableScan: 从表中读取数据。
    • table: 表的全名。例如,catalog1.database1.table1
    • read rows: 要读取的行数。
    • read bytes: 要读取的数据字节数。
    • partition total: 表的分区总数。
    • partition scanned: 要读取的分区数。
    • push downs: 要推送到存储层进行处理的过滤器和限制。
  • Filter: 过滤读取的数据。
    • filters: 用于过滤数据的谓词表达式。返回 false 的数据将被过滤掉。
  • EvalScalar: 计算标量表达式。例如,SELECT a+1 AS b FROM t 中的 a+1
    • expressions: 要计算的标量表达式。
  • AggregatePartial & AggregateFinal: 按键聚合并返回聚合函数的结果。
    • group by: 用于聚合的键。
    • aggregate functions: 用于聚合的函数。
  • Sort: 按键排序数据。
    • sort keys: 用于排序的表达式。
  • Limit: 限制返回的行数。
    • limit: 要返回的行数。
    • offset: 返回任何行之前要跳过的行数。
  • HashJoin: 使用 Hash Join 算法对两张表执行 Join 操作。Hash Join 算法将选择两张表中的一张作为构建侧来构建 Hash 表。然后使用另一张表作为探测侧从 Hash 表中读取匹配的数据以形成结果。
    • join type: JOIN 类型(INNER、LEFT OUTER、RIGHT OUTER、FULL OUTER、CROSS、SINGLE 或 MARK)。
    • build keys: 构建侧用于构建 Hash 表的表达式。
    • probe keys: 探测侧用于从 Hash 表中读取数据的表达式。
    • filters: 非等值 JOIN 条件,例如 t.a > t1.a
  • Exchange: 在 Databend 查询节点之间交换数据以进行分布式并行计算。
    • exchange type: 数据重分区类型(Hash、Broadcast 或 Merge)。
开始使用 Databend Cloud
低成本
快速分析
多种数据源
弹性扩展
注册