卸载 TSV 文件
卸载 TSV 文件
语法:
COPY INTO { internalStage | externalStage | externalLocation }
FROM { [<database_name>.]<table_name> | ( <query> ) }
FILE_FORMAT = (
TYPE = TSV,
RECORD_DELIMITER = '<character>',
FIELD_DELIMITER = '<character>',
COMPRESSION = gzip,
OUTPUT_HEADER = true -- 卸载时包含表头
)
[MAX_FILE_SIZE = <num>]
[DETAILED_OUTPUT = true | false]
- 更多 TSV 选项请参考 TSV 文件 格式选项
- 卸载到多个文件使用 MAX_FILE_SIZE 复制选项
- 更多语法细节请参考 COPY INTO location
教程
步骤 1. 创建外部 Stage
CREATE STAGE tsv_unload_stage
URL = 's3://unload/tsv/'
CONNECTION = (
ACCESS_KEY_ID = '<your-access-key-id>'
SECRET_ACCESS_KEY = '<your-secret-access-key>'
);
步骤 2. 创建自定义 TSV 文件格式
CREATE FILE FORMAT tsv_unload_format
TYPE = TSV,
COMPRESSION = gzip; -- 使用 gzip 压缩卸载
步骤 3. 卸载到 TSV 文件
COPY INTO @tsv_unload_stage
FROM (
SELECT *
FROM generate_series(1, 100)
)
FILE_FORMAT = (FORMAT_NAME = 'tsv_unload_format')
DETAILED_OUTPUT = true;
结果:
┌─────────────────────────────────────────────────────────────────────────────────────── ───┐
│ file_name │ file_size │ row_count │
├──────────────────────────────────────────────────────────────────┼───────────┼───────────┤
│ data_99e8f5c8-79d6-43d8-80d7-13e3f4c91dd5_0002_00000000.tsv.gz │ 160 │ 100 │
└──────────────────────────────────────────────────────────────────────────────────────────┘
步骤 4. 验证卸载的 TSV 文件
SELECT COUNT($1)
FROM @tsv_unload_stage
(
FILE_FORMAT => 'tsv_unload_format',
PATTERN => '.*[.]tsv[.]gz'
);
结果:
┌───────────┐
│ count($1) │
├───────────┤
│ 100 │
└───────────┘