跳到主要内容

COVID-19 数据仪表板

在本教程中,我们将加载、分析并创建一个名为“纽约时报 COVID-19 数据”的数据集的仪表板。该数据集包含美国每日更新的 COVID-19 病例、死亡人数及其他相关统计信息。它全面展示了疫情在全国、州和县级别的影响,提供了 2022 年各地区 COVID-19 情况的详细洞察。

字段描述
date报告的 COVID-19 累计数据的日期。
county数据条目对应的县名称。
state数据条目对应的状态名称。
fips与地点关联的 FIPS 代码。
cases确认的 COVID-19 病例累计数量。
deaths因 COVID-19 导致的死亡累计数量。

步骤 1:准备数据

“纽约时报 COVID-19 数据”是一个内置的示例数据集,您只需点击几下即可加载。目标表会自动创建,因此您无需提前创建它。

1

加载数据集

  1. 在 Databend Cloud 中,点击 概览 页面上的 加载数据 按钮。
  2. 在打开的页面上,选择 新建表 单选按钮,然后从 加载示例数据 下拉菜单中选择 Covid-19 Data from New York Times.CSV

Alt text

  1. 在下一页,选择一个数据库并为要创建的目标表设置一个名称。

Alt text

  1. 点击 确认。Databend Cloud 开始创建目标表并加载数据集。此过程可能需要几秒钟。
2

处理 NULL 值

在进行分析工作之前,建议检查表中的 NULL 和重复值,因为它们可能会影响结果。

  1. 创建一个工作表,并使用以下 SQL 语句检查表中是否存在 NULL 值:
SELECT COUNT(*)
FROM covid_19_us_2022_3812
WHERE date IS NULL OR country IS NULL OR state IS NULL OR flip IS NULL OR cases IS NULL OR deaths IS NULL;

此 SQL 语句返回 41571,表示包含至少一个 NULL 值的行数。

  1. 从表中删除包含至少一个 NULL 值的行:
DELETE FROM covid_19_us_2022_3812
WHERE date IS NULL OR country IS NULL OR state IS NULL OR flip IS NULL OR cases IS NULL OR deaths IS NULL;
2

处理重复值

  1. 在同一个工作表中,使用以下 SQL 语句检查表中的重复值:
SELECT date, country, state, flip, cases, deaths, COUNT(*)
FROM covid_19_us_2022_3812
GROUP BY date, country, state, flip, cases, deaths
HAVING COUNT(*) > 1;

此 SQL 语句返回 0,表示表中没有重复行,数据现在已准备好进行分析。

步骤 2:使用查询结果创建图表

在这一步中,我们将运行四个查询以从数据中提取洞察,并通过计分卡、饼图、条形图和折线图可视化结果。请为每个查询创建一个单独的工作表

1

2022 年美国总死亡人数

  1. 在工作表中运行以下 SQL 语句:
-- 计算 2022 年 12 月 31 日美国的总死亡人数
SELECT SUM(deaths)
FROM covid_19_us_2022_3812
WHERE date = '2022-12-31';
  1. 在工作表中使用查询结果创建一个计分卡:

Alt text

2

2022 年各州总死亡人数

  1. 在工作表中运行以下 SQL 语句:
-- 计算 2022 年 12 月 31 日各州的总死亡人数
SELECT state, SUM(deaths)
FROM covid_19_us_2022_3812
WHERE date = '2022-12-31'
GROUP BY state;
  1. 在工作表中使用查询结果创建一个饼图:

Alt text

3

维尔京群岛的病例与死亡人数

  1. 在工作表中运行以下 SQL 语句:
-- 检索 2022 年 12 月 31 日维尔京群岛的所有数据
SELECT * FROM covid_19_us_2022_3812
WHERE date = '2022-12-31' AND state = 'Virgin Islands';
  1. 在工作表中使用查询结果创建一个条形图:

Alt text

4

圣约翰每月累计病例与死亡人数

  1. 在工作表中运行以下 SQL 语句:
-- 检索每月末圣约翰的数据
SELECT * FROM covid_19_us_2022_3812
WHERE
(date = '2022-01-31'
OR date = '2022-02-28'
OR date = '2022-03-31'
OR date = '2022-04-30'
OR date = '2022-05-31'
OR date = '2022-06-30'
OR date = '2022-07-31'
OR date = '2022-08-31'
OR date = '2022-09-30'
OR date = '2022-10-31'
OR date = '2022-11-30'
OR date = '2022-12-31')
AND country = 'St. John' ORDER BY date;
  1. 在工作表中使用查询结果创建一个折线图:

Alt text

步骤 3:将图表添加到仪表板

  1. 在 Databend Cloud 中,在 仪表板 > 新建仪表板 中创建一个仪表板,然后点击仪表板上的 添加图表

  2. 将左侧的图表拖放到仪表板上。您可以根据需要调整图表的大小或位置。

Alt text