向量函数
本节提供了 Databend 中向量函数 (Vector Functions) 的参考信息。这些函数支持全面的向量操作,包括距离计算、相似度测量和向量分析,适用于机器学习应用、向量搜索和人工智能驱动的分析。
距离函数
函数 | 说明 | 示例 |
---|---|---|
COSINE_DISTANCE | 计算向量之间的角距离 (Angular Distance)(范围:0-1) | COSINE_DISTANCE([1,2,3], [4,5,6]) |
L1_DISTANCE | 计算向量之间的曼哈顿(L1)距离 (Manhattan Distance) | L1_DISTANCE([1,2,3], [4,5,6]) |
L2_DISTANCE | 计算欧几里得(直线)距离 (Euclidean Distance) | L2_DISTANCE([1,2,3], [4,5,6]) |
向量分析函数
函数 | 说明 | 示例 |
---|---|---|
INNER_PRODUCT | 计算两个向量的内积(点积)(Inner Product) | INNER_PRODUCT([1,2,3], [4,5,6]) |
VECTOR_NORM | 计算向量的 L2 范数(模长)(L2 Norm) | VECTOR_NORM([1,2,3]) |
VECTOR_DIMS | 返回向量的维度 (Vector Dimensions) | VECTOR_DIMS([1,2,3]) |
距离函数比较
函数 | 说明 | 范围 | 最适用场景 | 用例 |
---|---|---|---|---|
COSINE_DISTANCE | 向量之间的角距离 | [0, 1] | 当方向比大小更重要时 | • 文档相似度 • 语义搜索 • 推荐系统 • 文本分析 |
L1_DISTANCE | 向量之间的曼哈顿(L1)距离 | [0, ∞) | 对异常值具有鲁棒性 | • 特征比较 • 异常值检测 • 基于网格的路径规划 • 聚类算法 |
L2_DISTANCE | 欧几里得(直线)距离 | [0, ∞) | 当大小很重要时 | • 图像相似度 • 地理数据 • 异常检测 • 基于特征的聚类 |
向量分析函数比较
函数 | 说明 | 范围 | 最适用场景 | 用例 |
---|---|---|---|---|
INNER_PRODUCT | 两个向量的点积 | (-∞, ∞) | 测量向量相似度和投影 | • 神经网络 • 机器学习 • 物理计算 • 向量投影 |
VECTOR_NORM | 向量的 L2 范数(模长) | [0, ∞) | 向量归一化和模长计算 | • 向量归一化 • 特征缩放 • 模长计算 • 物理应用 |
VECTOR_DIMS | 向量的维度数 | [1, 4096] | 向量验证和处理 | • 数据验证 • 动态处理 • 调试 • 兼容性检查 |