Skip to main content

REGEXP_SPLIT_TO_TABLE

引入或更新于:v1.2.754

使用正则表达式(regular expression)模式拆分字符串,并将每个分段作为表返回。

语法

REGEXP_SPLIT_TO_TABLE(string, pattern [, flags text])
参数描述
string要拆分的输入字符串(可变字符(VARCHAR)类型)
pattern用于拆分的正则表达式模式(可变字符(VARCHAR)类型)
flags text用于修改正则表达式行为的标志字符串。

支持的 flags 参数: 提供灵活的正则表达式配置选项,通过组合以下字符来控制匹配行为:

  • i(不区分大小写):模式匹配忽略大小写。
  • c(区分大小写):模式匹配区分大小写(默认行为)。
  • nm(多行):启用多行模式。在此模式下,^$ 分别匹配字符串的开头和结尾,以及每行的开头和结尾;点 . 不匹配换行符。
  • s(单行):启用单行模式(也称为点匹配换行符)。在此模式下,点 . 匹配任何字符,包括换行符。
  • x(忽略空白):忽略模式中的空白字符(提高模式的可读性)。
  • q(字面量):将 pattern 视为字面量字符串而不是正则表达式。

示例

基本行生成

SELECT REGEXP_SPLIT_TO_TABLE('one,two,three', ',');
┌─────────┐
│ one │
│ two │
│ three │
└─────────┘

日志解析

SELECT REGEXP_SPLIT_TO_TABLE('ERR:404:File Not Found', ':');
┌──────────────────┐
│ ERR │
404
File Not Found │
└──────────────────┘

使用标志文本

SELECT regexp_split_to_table('One_Two_Three', '[_-]', 'i')

╭────────╮
│ One │
│ Two │
│ Three │
╰────────╯

嵌套使用

WITH data AS (
SELECT 'id=123,name=John' AS kv_pairs
)
SELECT
REGEXP_SPLIT_TO_TABLE(kv_pairs, ',') AS pair
FROM data;
┌──────────────┐
│ id=123
│ name=John │
└──────────────┘

另请参阅

Explore Databend Cloud for FREE
Low-cost
Fast Analytics
Easy Data Ingestion
Elastic Scaling
Try it today