跳到主要内容

INSPECT_PARQUET

引入或更新: v1.2.180

从暂存的 Parquet 文件中检索包含综合元数据的表格,包括以下列:

列名描述
created_by创建 Parquet 文件的实体或来源
num_columnsParquet 文件中的列数
num_rowsParquet 文件中的总行数或记录数
num_row_groupsParquet 文件中的行组数量
serialized_sizeParquet 文件在磁盘上的大小(压缩后)
max_row_groups_size_compressed最大的行组大小(压缩后)
max_row_groups_size_uncompressed最大的行组大小(未压缩)

语法

INSPECT_PARQUET('@<path-to-file>')

示例

此示例从名为 books.parquet 的暂存样本 Parquet 文件中检索元数据。该文件包含两条记录:

books.parquet
Transaction Processing,Jim Gray,1992
Readings in Database Systems,Michael Stonebraker,2004
-- 显示暂存文件
LIST @my_internal_stage;

┌──────────────────────────────────────────────────────────────────────────────────────────────┐
│ name │ size │ md5 │ last_modified │ creator │
├───────────────┼────────┼──────────────────┼───────────────────────────────┼──────────────────┤
│ books.parquet │ 998NULL2023-04-19 19:34:51.303 +0000NULL
└──────────────────────────────────────────────────────────────────────────────────────────────┘

-- 从暂存文件中检索元数据
SELECT * FROM INSPECT_PARQUET('@my_internal_stage/books.parquet');

┌────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ created_by │ num_columns │ num_rows │ num_row_groups │ serialized_size │ max_row_groups_size_compressed │ max_row_groups_size_uncompressed │
├────────────────────────────────────┼─────────────┼──────────┼────────────────┼─────────────────┼────────────────────────────────┼──────────────────────────────────┤
│ parquet-cpp version 1.5.1-SNAPSHOT321998332320
└────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
开始使用 Databend Cloud
低成本
快速分析
多种数据源
弹性扩展
注册