跳到主要内容

MindsDB

存储在数据库中的数据是一项宝贵的资产。MindsDB 使您能够利用数据并进行预测。它通过将机器学习引入数据库,加速了机器学习开发过程。借助 MindsDB,您无需其他平台即可构建、训练、优化和部署机器学习模型。

Databend 和 Databend Cloud 都可以作为数据源与 MindsDB 集成,从而为 Databend 带来机器学习能力。以下教程展示了如何与 MindsDB 集成并进行数据预测,以 首尔空气污染 数据集为例。

教程-1:将 Databend 与 MindsDB 集成

在开始之前,请安装本地 MindsDB 或注册 MindsDB Cloud 账户。本教程使用 MindsDB Cloud。有关如何安装本地 MindsDB 的更多信息,请参阅 https://docs.mindsdb.com/quickstart#1-create-a-mindsdb-cloud-account-or-install-mindsdb-locally

步骤 1. 将数据集加载到 Databend

运行以下 SQL 语句,在 default 数据库中创建一个表,并使用 COPY INTO 命令加载 首尔空气污染 数据集:

CREATE TABLE pollution_measurement(
MeasurementDate Timestamp,
StationCode String,
Address String,
Latitude double,
Longitude double,
SO2 double,
NO2 double,
O3 double,
CO double,
PM10 double,
PM25 double
);
COPY INTO pollution_measurement FROM 'https://datasets.databend.org/AirPolutionSeoul/Measurement_summary.csv' file_format=(type='CSV' skip_header=1);

步骤 2. 将 MindsDB 连接到 Databend

  1. 将以下 SQL 语句复制并粘贴到 MindsDB Cloud 编辑器中,然后点击 运行
CREATE DATABASE databend_datasource
WITH engine='databend',
parameters={
"protocol": "https",
"user": "<YOUR-USERNAME>",
"port": 8000,
"password": "<YOUR-PASSWORD>",
"host": "<YOUR-HOST>",
"database": "default"
};
提示

上述 SQL 语句将 Databend 中的 default 数据库连接到您的 MindsDB Cloud 账户。有关参数的解释,请参阅 https://docs.mindsdb.com/data-integrations/all-data-integrations#databend

  1. 在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以验证集成:
SELECT * FROM databend_datasource.pollution_measurement LIMIT 10;

Alt text

步骤 3. 创建预测器

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以创建预测器:

CREATE PREDICTOR airq_predictor
FROM databend_datasource (SELECT * FROM pollution_measurement LIMIT 50)
PREDICT so2;

现在预测器将开始训练。您可以使用以下查询检查状态:

SELECT *
FROM mindsdb.models
WHERE name='airq_predictor';
备注

模型状态必须为 complete 才能开始进行预测。

步骤 4. 进行预测

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以预测 SO2 的浓度:

SELECT
SO2 AS predicted,
SO2_confidence AS confidence,
SO2_explain AS info
FROM mindsdb.airq_predictor
WHERE (NO2 = 0.005)
AND (CO = 1.2)
AND (PM10 = 5)

输出:

Alt text

教程-2:将 Databend Cloud 与 MindsDB 集成

在开始之前,请安装本地 MindsDB 或注册 MindsDB Cloud 账户。本教程使用 MindsDB Cloud。有关如何安装本地 MindsDB 的更多信息,请参阅 https://docs.mindsdb.com/quickstart#1-create-a-mindsdb-cloud-account-or-install-mindsdb-locally

步骤 1. 将数据集加载到 Databend Cloud

在 Databend Cloud 中打开一个工作表,并运行以下 SQL 语句,在 default 数据库中创建一个表,并使用 COPY INTO 命令加载 首尔空气污染 数据集:

CREATE TABLE pollution_measurement(
MeasurementDate Timestamp,
StationCode String,
Address String,
Latitude double,
Longitude double,
SO2 double,
NO2 double,
O3 double,
CO double,
PM10 double,
PM25 double
);

COPY INTO pollution_measurement FROM 'https://repo.databend.com/AirPolutionSeoul/Measurement_summary.csv' file_format=(type='CSV' skip_header=1);

步骤 2. 将 MindsDB 连接到 Databend Cloud

  1. 将以下 SQL 语句复制并粘贴到 MindsDB Cloud 编辑器中,然后点击 运行
CREATE DATABASE databend_datasource
WITH engine='databend',
parameters={
"protocol": "https",
"user": "cloudapp",
"port": 443,
"password": "<YOUR-PASSWORD>",
"host": "<YOUR-HOST>",
"database": "default"
};
提示

上述 SQL 语句将 Databend Cloud 中的 default 数据库连接到您的 MindsDB Cloud 账户。参数值可以从您的仓库连接信息中获取。更多信息请参阅 连接到仓库。有关参数的解释,请参阅 https://docs.mindsdb.com/data-integrations/all-data-integrations#databend

  1. 在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以验证集成:
SELECT * FROM databend_datasource.pollution_measurement LIMIT 10;

Alt text

步骤 3. 创建预测器

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以创建预测器:

CREATE PREDICTOR airq_predictor
FROM databend_datasource (SELECT * FROM pollution_measurement LIMIT 50)
PREDICT so2;

现在预测器将开始训练。您可以使用以下查询检查状态:

SELECT *
FROM mindsdb.models
WHERE name='airq_predictor';
备注

模型状态必须为 complete 才能开始进行预测。

步骤 4. 进行预测

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以预测 SO2 的浓度:

SELECT
SO2 AS predicted,
SO2_confidence AS confidence,
SO2_explain AS info
FROM mindsdb.airq_predictor
WHERE (NO2 = 0.005)
AND (CO = 1.2)
AND (PM10 = 5)

输出:

Alt text

这篇文章对您有帮助吗?
Yes
No