JARO_WINKLER
引入或更新: v1.2.675
计算两个字符串之间的 Jaro-Winkler 距离。它通常用于衡量字符串之间的相似性,取值范围从 0.0(完全不相似)到 1.0(完全相同)。
语法
JARO_WINKLER(<string1>, <string2>)
返回类型
JARO_WINKLER 函数返回一个 FLOAT64 值,表示两个输入字符串之间的相似性。返回值遵循以下规则:
-
相似性范围:结果范围从 0.0(完全不相似)到 1.0(完全相同)。
示例:SELECT JARO_WINKLER('databend', 'Databend') AS similarity;
┌────────────────────┐
│ similarity │
├────────────────────┤
│ 0.9166666666666666 │
└────────────────────┘
SELECT JARO_WINKLER('databend', 'database') AS similarity;
┌────────────┐
│ similarity │
├────────────┤
│ 0.9 │
└────────────┘ -
NULL 处理:如果 string1 或 string2 为 NULL,结果为 NULL。
示例:SELECT JARO_WINKLER('databend', NULL) AS similarity;
┌────────────┐
│ similarity │
├────────────┤
│ NULL │
└────────────┘ -
空字符串:
- 比较两个空字符串返回 1.0。
示例:SELECT JARO_WINKLER('', '') AS similarity;
┌────────────┐
│ similarity │
├────────────┤
│ 1 │
└────────────┘- 比较一个空字符串与一个非空字符串返回 0.0。
示例:SELECT JARO_WINKLER('databend', '') AS similarity;
┌────────────┐
│ similarity │
├────────────┤
│ 0 │
└────────────┘