查询暂存区（Stage）中的 Parquet 文件

语法：

教程

第 1 步：创建外部暂存区（Stage）

使用你自己的 S3 存储桶和凭据创建一个外部暂存区（Stage），你的 Parquet 文件就存储在该存储桶中。

CREATE STAGE parquet_query_stage 
URL = 's3://load/parquet/' 
CONNECTION = (
    ACCESS_KEY_ID = '<your-access-key-id>' 
    SECRET_ACCESS_KEY = '<your-secret-access-key>'
);

第 2 步：创建自定义 Parquet 文件格式

CREATE FILE FORMAT parquet_query_format TYPE = PARQUET;

更多 Parquet 文件格式选项，请参阅 Parquet 文件格式选项

第 3 步：查询 Parquet 文件

按列名查询：

SELECT *
FROM @parquet_query_stage
(
    FILE_FORMAT => 'parquet_query_format',
    PATTERN => '.*[.]parquet'
);

按路径表达式查询：

SELECT $1
FROM @parquet_query_stage
(
    FILE_FORMAT => 'parquet_query_format',
    PATTERN => '.*[.]parquet'
);

查询元数据

直接从暂存区（Stage）查询 Parquet 文件，包括 METADATA$FILENAME 和 METADATA$FILE_ROW_NUMBER 等元数据列：

SELECT
    METADATA$FILENAME,
    METADATA$FILE_ROW_NUMBER,
    *
FROM @parquet_query_stage
(
    FILE_FORMAT => 'parquet_query_format',
    PATTERN => '.*[.]parquet'
);

查询暂存区（Stage）中的 Parquet 文件

语法：

教程

第 1 步：创建外部暂存区（Stage）

第 2 步：创建自定义 Parquet 文件格式

第 3 步：查询 Parquet 文件

查询元数据

加入我们的社区

GitHub

知乎

bilibili

开源中国

微信

销售电话

欢迎体验 Databend Cloud

语法：​

教程​

第 1 步：创建外部暂存区（Stage）​

第 2 步：创建自定义 Parquet 文件格式​

第 3 步：查询 Parquet 文件​

查询元数据​

加入我们的社区

GitHub

知乎

bilibili

开源中国

微信

销售电话

欢迎体验 Databend Cloud

语法：

教程

第 1 步：创建外部暂存区（Stage）

第 2 步：创建自定义 Parquet 文件格式

第 3 步：查询 Parquet 文件

查询元数据