跳到主要内容

仪表盘使用指南

本教程将加载、分析并为数据集“纽约时报 Covid-19 数据”创建一个 Dashboard。该数据集每日更新美国全国的病例、死亡和其他相关指标,可从国家、州、县等不同维度展现 2022 年疫情的全貌。

字段说明
date已累积 Covid-19 数据的日期。
county数据所属的县。
state数据所属的州。
fips对应地区的 FIPS 代码。
cases已确认病例的累计数量。
deaths因 Covid-19 去世的累计数量。

步骤 1:准备数据

“纽约时报 Covid-19 数据”是一个内置示例数据集,只需几次点击即可加载。Databend Cloud 会自动创建目标表,无需事先建表。

1

加载数据集

  1. 在 Databend Cloud 的 Overview 页面点击 Load Data
  2. 在弹出的向导中选择 A new table,然后在 Load sample data 下拉列表中选择 Covid-19 Data from New York Times.CSV

Alt text

  1. 在下一页中,选择数据库并为要创建的目标表命名。

Alt text

  1. 点击 Confirm。Databend Cloud 会创建目标表并加载数据,过程可能需要几秒钟。
2

处理 NULL

在分析前建议检查并处理表中的 NULL 与重复值,以免影响结果。

  1. 新建 Worksheet,运行以下 SQL 检查表内是否存在 NULL:
SELECT COUNT(*)
FROM covid_19_us_2022_3812
WHERE date IS NULL OR country IS NULL OR state IS NULL OR fips IS NULL OR cases IS NULL OR deaths IS NULL;

返回的 41571 表示至少包含一个 NULL 的行数。

  1. 删除所有包含 NULL 的行:
DELETE FROM covid_19_us_2022_3812
WHERE date IS NULL OR country IS NULL OR state IS NULL OR fips IS NULL OR cases IS NULL OR deaths IS NULL;
2

处理重复行

  1. 在同一个 Worksheet 中运行以下 SQL 检查重复记录:
SELECT date, country, state, fips, cases, deaths, COUNT(*)
FROM covid_19_us_2022_3812
GROUP BY date, country, state, fips, cases, deaths
HAVING COUNT(*) > 1;

该查询返回 0,表示没有重复记录,数据可以用于分析。

步骤 2:基于查询结果创建图表

此步骤将运行四条查询,并将结果可视化为计分卡、饼图、柱状图与折线图。请为每条查询创建单独的 Worksheet

1

2022 年全美死亡总数

  1. 在 Worksheet 中运行以下 SQL:
-- 统计 2022-12-31 当天美国的累积死亡总数
SELECT SUM(deaths)
FROM covid_19_us_2022_3812
WHERE date = '2022-12-31';
  1. 基于查询结果创建计分卡:

Alt text

2

各州死亡总数(2022)

  1. 在 Worksheet 中运行以下 SQL:
-- 统计 2022-12-31 当天各州的累积死亡人数
SELECT state, SUM(deaths)
FROM covid_19_us_2022_3812
WHERE date = '2022-12-31'
GROUP BY state;
  1. 使用查询结果创建饼图:

Alt text

3

维京群岛的病例与死亡

  1. 在 Worksheet 中运行以下 SQL:
-- 查询 2022-12-31 维京群岛的全部数据
SELECT * FROM covid_19_us_2022_3812
WHERE date = '2022-12-31' AND state = 'Virgin Islands';
  1. 基于结果创建柱状图:

Alt text

4

圣约翰各月的病例与死亡

  1. 在 Worksheet 中运行以下 SQL:
-- 获取 2022 年每月底圣约翰的数据
SELECT * FROM covid_19_us_2022_3812
WHERE
(date = '2022-01-31'
OR date = '2022-02-28'
OR date = '2022-03-31'
OR date = '2022-04-30'
OR date = '2022-05-31'
OR date = '2022-06-30'
OR date = '2022-07-31'
OR date = '2022-08-31'
OR date = '2022-09-30'
OR date = '2022-10-31'
OR date = '2022-11-30'
OR date = '2022-12-31')
AND country = 'St. John' ORDER BY date;
  1. 创建折线图展示结果:

Alt text

步骤 3:将图表添加到 Dashboard

  1. 在 Databend Cloud 中访问 Dashboards > New Dashboard 创建一个新的 Dashboard,并点击 Add Chart
  2. 将左侧的图表拖放到 Dashboard,可以根据需要调整尺寸与位置。

Alt text

欢迎体验 Databend Cloud

基于 Rust + 对象存储构建的新一代多模态数仓,一个平台即可进行 BI、向量、全文检索及地理空间分析。

支持标准 SQL,自动弹性伸缩,助您快速构建现代化数据平台。

注册即领 ¥200 代金券。

注册体验