跳到主要内容

TPC-H 基准测试:Databend Cloud vs. Snowflake

快速概览

TPC-H

TPC-H 基准测试是评估决策支持系统的标准,专注于复杂查询和数据维护。在此分析中,我们使用 TPC-H SF100(SF1 = 600 万行)数据集,涵盖 100GB 数据和约 6 亿行,对 22 个查询进行 Databend Cloud 与 Snowflake 的比较。

免责声明

TPC Benchmark™ 和 TPC-H™ 是事务处理性能委员会(TPC)的商标。我们的基准测试虽然受 TPC-H 启发,但不可直接与官方 TPC-H 结果相比较。

Snowflake 和 Databend Cloud

  • Snowflake:Snowflake 以其先进功能著称,如存储与计算分离、按需可扩展计算、数据共享和克隆能力。

  • Databend Cloud:Databend Cloud 提供与 Snowflake 类似功能,作为一个云原生数仓,同样实现存储与计算分离,并按需提供可扩展计算。它源自开源项目 Databend,定位为现代、成本效益高的 Snowflake 替代品,尤其适用于大规模分析。

性能与成本比较

  • 数据加载成本:Databend 在数据加载方面比 Snowflake 节省 67% 的成本
  • 查询执行成本:Databend 的查询执行成本比 Snowflake 大约 低 60%
注意

在此基准测试中,未进行特殊调优。Snowflake 和 Databend Cloud 均使用默认设置。 请记住,不要仅凭我们的说法 — 鼓励您自行运行并验证这些结果。

数据加载基准

image

Snowflake(695s, 成本 $0.77)Databend Cloud(446s, 成本 $0.25)行数
customer18.13713.43615,000,000
lineitem477.740305.812600,037,902
nation1.3470.70825
orders103.08864.323150,000,000
part19.90812.19220,000,000
partsupp67.41045.34680,000,000
region0.7430.7255
supplier3.0003.68710,000,000
总时间695s446s
总成本$0.77$0.25
存储大小20.8GB24.5GB

查询基准:冷启动

image

查询Snowflake(总时间 207s, 成本 $0.23)Databend Cloud(总时间 166s, 成本 $0.09)
TPC-H 111.7038.036
TPC-H 24.5243.786
TPC-H 38.9086.040
TPC-H 48.1084.462
TPC-H 59.2027.014
TPC-H 61.2373.234
TPC-H 79.0827.345
TPC-H 810.8868.976
TPC-H 918.15213.340
TPC-H 1013.52512.891
TPC-H 112.5822.183
TPC-H 1210.0998.839
TPC-H 1313.4587.206
TPC-H 148.0014.612
TPC-H 158.7374.621
TPC-H 164.8641.645
TPC-H 175.36314.315
TPC-H 1819.97112.058
TPC-H 199.89312.579
TPC-H 208.5388.836
TPC-H 2116.43912.270
TPC-H 223.7441.926
总时间207s166s
总成本$0.23$0.09

查询基准:热启动

image

查询Snowflake (总计 138s, 成本 $0.15)Databend Cloud (总计 124s, 成本 $0.07)
TPC-H 18.9347.568
TPC-H 23.0183.125
TPC-H 36.0895.234
TPC-H 44.9143.392
TPC-H 55.8004.857
TPC-H 60.8912.142
TPC-H 75.3814.389
TPC-H 85.7245.887
TPC-H 910.2839.621
TPC-H 1010.3688.524
TPC-H 111.1651.364
TPC-H 127.0525.352
TPC-H 1312.8296.180
TPC-H 143.2882.725
TPC-H 153.4752.748
TPC-H 164.0941.124
TPC-H 174.20313.757
TPC-H 1818.58311.630
TPC-H 193.8887.881
TPC-H 206.3795.797
TPC-H 2110.2879.806
TPC-H 221.5731.122
总时间138s124s
总成本$0.15$0.07

重现基准测试

您可以按照以下步骤重现基准测试。

基准测试环境

Snowflake 和 Databend Cloud 在相似条件下进行了测试:

参数SnowflakeDatabend Cloud
计算集群大小SmallSmall
vCPU1616
价格$4/小时$2/小时
AWS 区域us-east-2us-east-2
存储AWS S3AWS S3
  • TPC-H SF100 数据集,源自 Amazon Redshift,被加载到 Databend Cloud 和 Snowflake 中,未进行任何特定调优。

基准测试方法

我们对查询执行进行了冷启动和热启动测试:

  1. 冷启动:在执行查询前暂停并恢复数仓。
  2. 热启动:数仓未暂停,使用本地磁盘缓存。

前提条件

数据加载

  1. Snowflake 数据加载

  2. Databend Cloud 数据加载

TPC-H 查询

  1. Snowflake 查询

  2. Databend Cloud 查询