用 Superset 和 Druid 快速打造实时数据分析看板

2023-04-20  本文已影响0人  程序员赤小豆_gzh同名

Apache Superset是一款开源的企业级数据可视化和探索平台。它具有直观的界面,丰富的图表与仪表盘类型,并支持大规模数据集,方便进行实时分析与探索。Apache Druid是一款高性能、分布式、低延迟的OLAP数据存储方案。它适用于数据探查和快速数据摘要等场景,能轻松应对PB级数据。


Screenshot 2023-04-21 at 10.59.51 PM.png

本文将介绍如何结合Superset和Druid这两个优秀的开源软件,快速搭建一个实时数据分析看板应用。将二者整合,我们可以轻松实现一个帮助企业快速监控数据、获得数据洞察的智能平台。

一、环境准备

  1. 安装 Druid,安装和配置Superset
    安装步骤省略,可自行搜索。

  2. 添加 Druid 数据源

二、构建Druid数据表和查询

  1. 登录Druid Console, 构建数据表
    在Druid Console通过上传数据文件或提供数据流的方式创建数据表

  2. 定义复杂的查询
    Druid支持丰富的查询类型, 如GroupBy、TopN、Timeseries等...(查询语法示例)

{
  "queryType": "groupBy",
  "dataSource": "wikiticker", 
  "granularity": "all",
  "dimensions": ["page","country"],
  "aggregations": {
    "count": "count"
  },
  "intervals": [
    "2020-01-01/2020-01-02"
  ] 
}

三、在 Superset 中创建报表

  1. 新建Druid表格视图
    在Superset中,我们需要创建表格视图来显示Druid数据集的数据。新建Druid表格视图的步骤如下:
  1. 使用多种图表类型可视化数据
    在新建的表格视图上,点击工具栏的“创建图表”按钮,选择要使用的图表类型,即可将查询结果以图表形式进行可视化展示。

Superset支持线图、柱状图、散点图、地图、盒形图等多种图表类型,选择合适的可视化形式。

  1. 构建实时数据看板
    将创建好的多个图表和文本框拖动到仪表盘,设置自动刷新间隔,即可以实现一个实时数据监控看板。
    步骤如下:

四、总结
通过 Superset 和 Druid,我们实现了一个实时数据分析看板应用。Druid提供实时和历史数据的存储与查询,Superset通过丰富的可视化手段, 将Druid查询结果呈现直观的网页报表和仪表盘。

写作是一个学习和思考的过程, 我也会不断总结与改进。谢谢阅读,如果你对文章中的内容有疑惑,欢迎点击我头像,看我个人介绍,与我取得联系,谢谢~

上一篇下一篇

猜你喜欢

热点阅读