查询哈希
查询哈希是一个用于表示唯一SQL查询的标识符。它将查询的结构和内容转换为固定长度的值,因此即使查询文本有细微差异,只要逻辑结构相同,哈希值也会相同。这有助于识别相似查询和频繁执行的查询。
查询哈希类型
Databend支持两种类型的查询哈希:
-
query_hash
:query_hash确保重复查询,即使存在空格或注释的变化,共享相同的哈希。例如,以下查询共享相同的哈希:SELECT * FROM t1 WHERE name = 'jim'
SELECT * FROM t1 WHERE name = 'jim' -
query_parameterized_hash
:query_parameterized_hash通过处理比较谓词中的字面量(例如,=
、!=
、>=
、<=
)来规范化查询,从而能够识别结构相似的查询,无论使用的具体值如何。例如,以下查询共享相同的哈希:SELECT * FROM t1 WHERE name = 'data'
SELECT * FROM t1 WHERE name = 'bend'
获取哈希值
Databend将历史查询的哈希值存储在系统表system.query_log的query_hash
和query_parameterized_hash
列中。要获取查询的哈希值,可以使用SELECT语句从系统表中提取它们。例如:
SELECT * FROM books;
┌───────────────────────────────────────────────────────────────┐
│ id │ title │ genre │
├──────────────────┼─────────────────────────┼──────────────────┤
│ 1 │ To Kill a Mockingbird │ Fiction │
│ 2 │ A Brief History of Time │ Science │
└───────────────────────────────────────────────────────────────┘
SELECT query_text, query_hash, query_parameterized_hash
FROM system.query_log
WHERE query_text = 'SELECT * FROM books';
┌───────────────────────────────────────────────────────────────────────────────────────────┐
│ query_text │ query_hash │ query_parameterized_hash │
├─────────────────────┼──────────────────────────────────┼──────────────────────────────────┤
│ SELECT * FROM books │ 7e612be4897104109449c74d3970c9e7 │ 7e612be4897104109449c74d3970c9e7 │
│ SELECT * FROM books │ 7e612be4897104109449c74d3970c9e7 │ 7e612be4897104109449c74d3970c9e7 │
└───────────────────────────────────────────────────────────────────────────────────────────┘