跳到主要内容

TPC-H SF1000 性能对比:Small / Medium / Large Warehouse

本文使用 TPC-H SF1000(约 1TB)数据集,对比 Databend Cloud 三种规格 Warehouse(Small、Medium、Large)的查询性能表现。

数据规模

TPC-H Scale Factor 1000(SF1000)表示约 1TB 的生成数据。该数据集包含 8 张 TPC-H 标准表,总行数约 60 亿行。

行数
customer150,000,000
lineitem6,000,000,000
nation25
orders1,500,000,000
part200,000,000
partsupp800,000,000
region5
supplier10,000,000
Disclaimer

TPC Benchmark™ 和 TPC-H™ 是事务处理性能委员会 (TPC) 的商标。本文测试受 TPC-H 启发,但不属于官方 TPC-H 结果。

总览

Warehouse 规格总耗时相对 Small 加速比相对上一档加速比
Small1173.32 s1.00x
Medium537.93 s2.18x2.18x
Large285.96 s4.10x1.88x

TPC-H SF1000 Warehouse Size Benchmark

Medium 约为 Small 的 2.18x。Large 约为 Small 的 4.10x,可在 5 分钟内完成 22 条 Query。

Query 明细

单位:秒。数值越低越好。

QuerySmallMediumLargeSmall → MediumMedium → Large
Q131.6119.9310.331.59x1.93x
Q210.007.155.521.40x1.30x
Q373.0724.5017.752.98x1.38x
Q4177.6017.2216.3910.31x1.05x
Q5300.7817.6911.2217.00x1.58x
Q613.934.462.193.12x2.04x
Q733.0818.089.781.83x1.85x
Q831.3717.8110.901.76x1.63x
Q9102.0145.4129.522.25x1.54x
Q1040.8431.1823.051.31x1.35x
Q115.913.592.201.65x1.63x
Q1223.7411.818.702.01x1.36x
Q1357.7834.5223.781.67x1.45x
Q1438.459.845.183.91x1.90x
Q1513.228.184.821.62x1.70x
Q164.773.252.271.47x1.43x
Q1720.7711.295.871.84x1.92x
Q1890.78158.8917.240.57x9.22x
Q1920.3610.868.221.87x1.32x
Q2025.3410.074.942.52x2.04x
Q2152.8564.5761.190.82x1.06x
Q225.067.644.900.66x1.56x
合计1173.32537.93285.962.18x1.88x

说明

整体查询性能随 Warehouse 规格提升有清晰收益。个别 Query 不完全线性,通常与查询形态、执行计划、调度和缓存行为有关。

欢迎体验 Databend Cloud

基于 Rust + 对象存储构建的新一代多模态数仓,一个平台即可进行 BI、向量、全文检索及地理空间分析。

支持标准 SQL,自动弹性伸缩,助您快速构建现代化数据平台。

注册即领 ¥200 代金券。

注册体验