跳到主要内容

MindsDB

数据库中的数据是一项宝贵的资产。MindsDB 使您能够使用您的数据并进行预测。它通过将机器学习引入数据库,加速了机器学习开发过程。使用 MindsDB,您可以在不需要其他平台的情况下构建、训练、优化和部署您的机器学习模型。

Databend 和 Databend Cloud 都可以集成 MindsDB 作为数据源,这为 Databend 带来了机器学习能力。以下教程将向您展示如何与 MindsDB 集成并使用首尔空气污染数据集进行数据预测。

教程-1:将 Databend 与 MindsDB 集成

在开始之前,请安装本地 MindsDB 或注册 MindsDB Cloud 账户。本教程使用 MindsDB Cloud。有关如何安装本地 MindsDB 的更多信息,请参考 https://docs.mindsdb.com/quickstart#1-create-a-mindsdb-cloud-account-or-install-mindsdb-locally

步骤 1. 将数据集加载到 Databend

运行以下 SQL 语句,在数据库default中创建一个表,并使用 COPY INTO 命令加载首尔空气污染数据集:

CREATE TABLE pollution_measurement(
MeasurementDate Timestamp,
StationCode String,
Address String,
Latitude double,
Longitude double,
SO2 double,
NO2 double,
O3 double,
CO double,
PM10 double,
PM25 double
);
COPY INTO pollution_measurement FROM 'https://datasets.databend.org/AirPolutionSeoul/Measurement_summary.csv' file_format=(type='CSV' skip_header=1);

步骤 2. 将 MindsDB 连接到 Databend

  1. 复制并粘贴以下 SQL 语句到 MindsDB Cloud 编辑器,并点击运行
CREATE DATABASE databend_datasource
WITH engine='databend',
parameters={
"protocol": "https",
"user": "<YOUR-USERNAME>",
"port": 8000,
"password": "<YOUR-PASSWORD>",
"host": "<YOUR-HOST>",
"database": "default"
};
提示

上面的 SQL 语句将 Databend 中的数据库default连接到您的 MindsDB Cloud 账户。关于参数的解释,请参考 https://docs.mindsdb.com/data-integrations/all-data-integrations#databend

  1. 在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以验证集成:
SELECT * FROM databend_datasource.pollution_measurement LIMIT 10;

Alt text

步骤 3. 创建预测器

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句创建预测器:

CREATE PREDICTOR airq_predictor
FROM databend_datasource (SELECT * FROM pollution_measurement LIMIT 50)
PREDICT so2;

现在预测器将开始训练。您可以使用以下查询检查状态:

SELECT *
FROM mindsdb.models
WHERE name='airq_predictor';
备注

模型的状态必须是complete,然后您才能开始进行预测。

步骤 4. 进行预测

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句来预测 SO2 的浓度:

SELECT
SO2 AS predicted,
SO2_confidence AS confidence,
SO2_explain AS info
FROM mindsdb.airq_predictor
WHERE (NO2 = 0.005)
AND (CO = 1.2)
AND (PM10 = 5)

输出:

Alt text

教程-2:将 Databend Cloud 与 MindsDB 集成

在开始之前,请安装本地 MindsDB 或注册 MindsDB Cloud 账户。本教程使用 MindsDB Cloud。有关如何安装本地 MindsDB 的更多信息,请参考 https://docs.mindsdb.com/quickstart#1-create-a-mindsdb-cloud-account-or-install-mindsdb-locally

步骤 1. 将数据集加载到 Databend Cloud

在 Databend Cloud 中打开一个工作表,并运行以下 SQL 语句在数据库default中创建一个表,并使用 COPY INTO 命令加载首尔空气污染数据集:

CREATE TABLE pollution_measurement(
MeasurementDate Timestamp,
StationCode String,
Address String,
Latitude double,
Longitude double,
SO2 double,
NO2 double,
O3 double,
CO double,
PM10 double,
PM25 double
);

COPY INTO pollution_measurement FROM 'https://repo.databend.rs/AirPolutionSeoul/Measurement_summary.csv' file_format=(type='CSV' skip_header=1);

步骤 2. 将 MindsDB 连接到 Databend Cloud

  1. 复制并粘贴以下 SQL 语句到 MindsDB Cloud 编辑器,并点击运行
CREATE DATABASE databend_datasource
WITH engine='databend',
parameters={
"protocol": "https",
"user": "cloudapp",
"port": 443,
"password": "<YOUR-PASSWORD>",
"host": "<YOUR-HOST>",
"database": "default"
};
提示

上面的 SQL 语句将 Databend Cloud 中的数据库default连接到您的 MindsDB Cloud 账户。参数值可以从您的计算集群连接信息中获得。更多信息,请参见连接到计算集群。关于参数的解释,请参考 https://docs.mindsdb.com/data-integrations/all-data-integrations#databend

  1. 在 MindsDB Cloud 编辑器中,运行以下 SQL 语句以验证集成:
SELECT * FROM databend_datasource.pollution_measurement LIMIT 10;

Alt text

步骤 3. 创建预测器

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句创建预测器:

CREATE PREDICTOR airq_predictor
FROM databend_datasource (SELECT * FROM pollution_measurement LIMIT 50)
PREDICT so2;

现在预测器将开始训练。您可以使用以下查询检查状态:

SELECT *
FROM mindsdb.models
WHERE name='airq_predictor';
备注

模型的状态必须是complete,然后您才能开始进行预测。

步骤 4. 进行预测

在 MindsDB Cloud 编辑器中,运行以下 SQL 语句来预测 SO2 的浓度:

SELECT
SO2 AS predicted,
SO2_confidence AS confidence,
SO2_explain AS info
FROM mindsdb.airq_predictor
WHERE (NO2 = 0.005)
AND (CO = 1.2)
AND (PM10 = 5)

输出:

Alt text

这篇文章对您有帮助吗?
Yes
No