【demos】基于 oceanbase 构建可视化数据看板-c7电子娱乐
本教程介绍如何将 ob cloud 云数据库中的数据导入 superset 进行展示和数据分析。
本篇教程也同步在 ob cloud 控制台上线了交互式教程,可以跟随教程在真实的 ob cloud 环境中进行互动体验。登录 后,单击左侧导航栏的 实践教程 即可查看全部已上线的交互式教程。
前提条件
- 您已在本地完成配置并运行 superset。详情请参见 。
- 您有可用的分析型实例(共享实例或集群实例均可)。如果您目前没有可用的实例,可以 ,点击查看 。
- 您已准备好可用数据集。本教程所用示例数据集为 kaggle 的 。
步骤一:获取 ob cloud 云数据库连接串
1. 在实例列表页面,在目标实例下,单击 连接,然后选择 获取连接串。
2. 在弹出框中选择 使用公共网络。
3. 在 使用公共网络连接 页面完成如下设置,生成连接串:
- 步骤 1:获取公网地址:单击 获取访问地址。当公网地址获取成功后,单击 下一步。
- 步骤 2:安全设置:在 1. 添加 ip 地址 下,单击 添加,将您的出口 ip 添加至白名单;然后在 2. 下载证书 下,下载 ca 证书,并进行配置。完成后,单击 下一步。
- 步骤 3:连接:在 数据库 和 账号 的下拉框中,单击按钮分别新建一个数据库和一个账号,然后选择 mysql cli 作为连接方式。
注意:创建账号后,请您妥善记录创建账号时生成的密码。
步骤二:在 superset 控制台连接 ob cloud 云数据库
1. 打开运行的 superset 控制台页面,在右上角选择 > data > connect database。
2. 在弹出框中,完成如下配置:
- 在第一步 select a database to connect 下,选择 mysql 数据库类型。
- 在第二步 enter the required mysql credentials 下,根据在 ob cloud 云数据库控制台上生成的连接串信息依次完成填写如下配置。您可以自定义 display name 的内容。
- host:取自连接串中 -h 参数,ob cloud 云数据库连接地址。
- port:取自连接串中 -p 参数,ob cloud 云数据库连接端口。
- database name:取自连接串中 -d 参数,需要访问的数据库名称。
- username:取自连接串中 -u 参数,账号名称。
- password:取自连接串中 -p 参数,账号密码。
3. 单击 connect,然后单击 finish。
步骤三:在 ob cloud 控制台创建表
1. 在实例列表页面,展开目标实例,在目标租户下,单击 连接,然后选择 sql 控制台。
2. 在 sql 控制台页面,选择您在步骤一中创建的账号,并输入密码,然后单击 连接 登录 sql 控制台。
3. 在 sql 编辑器中,切换数据库为您在步骤一中创建的数据库。
4. 在编辑器中输入以下 sql 语句,单击 按钮执行 sql 语句创建名称为 ev_data 的表。
create table ev_data (
region varchar(100),
category varchar(100),
parameter varchar(100),
mode varchar(50),
powertrain varchar(100),
year int,
unit varchar(100),
value float
) with column group(all columns, each column);
步骤四:在 ob cloud 控制台导入数据
1. 回到 ob cloud 控制台的实例列表页,在目标实例右侧,选择 ... > 导入数据文件。
2. 在 本地文件 页签下,上传您在前提条件中下载的数据集。
注意:ob cloud 不支持上传文件名中包含空格的文件。如果您下载的数据集文件名中包含空格,您需要先去掉空格,否则可能会导致上传失败。
3. 在 导入数据库 下,选择您在步骤一创建的数据库,在 表 下输入步骤三创建的表名 ev_data,然后单击 预览。
4. 在 导入数据文件 - 预览 下预览数据。若无问题,单击 导入 完成上传。
步骤五:在 superset 中创建数据集
1. 回到 superset 控制台,在右上角选择 > data > create dataset。
2. 在 new dataset 页面,完成如下配置:
配置项 | 说明 |
---|---|
database | 选择您在步骤二的 display name 中定义的数据库名。 |
schema | 选择您在步骤一中创建的 ob cloud 数据库。 |
table | 选择您在步骤三中创建的表。 |
3. 单击 create dataset and create chart,完成创建数据集。
步骤六:在 superset 中创建可视化图表
1. 创建 dashboard。
a. 在 superset 控制台页面顶部,单击 dashboards 页签,然后在 dashboards 页面,单击右上角的 dashboard。
b. 在新建的 dashboard 页面左上角自定义该 dashboard 的名称,例如 ev demo。
2. 在 dashboard 中配置图表。本教程以创建一个折线图展示各地区历年电动汽车销量为例,介绍在 superset 中配置图表的操作步骤,您也可以根据您的需求创建自己的图表。
a. 在 superset 控制台页面顶部,选择 sql > sql lab,并在 sql 编辑器中执行以下 sql 语句。
select region,year, sum(value) as total_ev_sales
from ev_data where
parameter = 'ev sales'
group by region,year
order by year;
b. 在 results 页签下,单击 create chart。
c. 在 data 页签下,完成如下配置:x-axis 选择 year;metrics 下,column 选择 total_ev_sales,aggregate 选择 sum;dimensions 选择 region。
d. 单击 update chart,然后在页面右上角单击 save。
e. 在 save chart 对话框中,填写图表名称,如“各地区历年电动汽车销量变”,以及数据集名称。然后在 add to dashboard 栏中选择步骤 1 中创建的 dashboard。
f. 单击 save & go to dashboard,即可在您创建的大盘中查看您所配置的图表。