聚合索引
聚合索引的主要目的是提升查询性能,特别是在涉及聚合查 询(如MIN、MAX和SUM)的场景中。它通过预先计算并存储查询结果在单独的块中,从而无需扫描整个表,加快数据检索速度。在使用聚合索引时,请注意以下事项:
-
创建聚合索引时,限制其使用于标准的聚合函数(例如,AVG、SUM、MIN、MAX、COUNT和GROUP BY),同时注意GROUPING SETS、窗口函数、LIMIT和ORDER BY不被接受,否则会报错:
Currently create aggregating index just support simple query, like: SELECT ... FROM ... WHERE ... GROUP BY ...
。 -
创建聚合索引时定义的查询过滤范围应与实际查询的范围匹配或包含实际查询的范围。
-
要确认聚合索引是否对查询有效,请使用EXPLAIN命令分析查询。
-
如果不再需要聚合索引,请考虑删除它。请注意,删除聚合索引不会移除关联的存储块。要同时删除块,请使用VACUUM TABLE命令。要禁用聚合索引功能,请将
enable_aggregating_index_scan
设置为0。
刷新聚合索引
由于表在创建聚合索引后可能会进行数据插入和更新,因此聚合索引需要定期刷新。您有以下选项来刷新聚合索引:
-
自动刷新:如果聚合索引使用SYNC关键字创 建,当表接收到可能影响查询结果的数据更新时,聚合索引将自动刷新。更多信息,请参见CREATE AGGREGATING INDEX。
-
手动刷新:如果聚合索引未使用SYNC关键字创建,聚合索引不会自动刷新。您可以使用REFRESH AGGREGATING INDEX命令手动刷新。在这种情况下,Databend建议在执行相关查询之前刷新聚合索引。
Databend中的自动刷新机制可能会影响大量数据加载的持续时间。这是因为Databend会延迟数据加载结果,直到自动刷新的聚合索引已更新以反映最新结果。Databend Cloud用户建议使用手动刷新机制。这是因为Databend Cloud会自动在后台更新聚合索引,即使对于未使用SYNC关键字创建的索引,也会响应表数据的变化进行更新。