数据探索分析平台-zeppelin
2022-02-26 本文已影响0人
reco171
zeppelin是一个非常流行的开源数据探索分析平台。提供Web笔记编辑,支持数据驱动,使用 SQL、Scala、Python、R 等语言进行交互式数据分析和协作文档。
- 组成
zeppelin由notebook、paragraph、Interpreter等组成,其核心组织概念是notebook,所有的操作都可以在notebook中完成。zeppelin集成了非常多的数据处理和分析相关的组件,实现数据探索(Data Ingestion)、 数据发现(Data Discovery)、 数据分析(Data Analytics)、数据可视化协作(Data Visualization & Collaboration)。 - 特性
1)Web数据分析
Apache Zeppelin 解释器允许将多种语言代码插入到 Zeppelin。 目前 Apache Zeppelin 支持多种解释器,如 Apache Spark、Apache Flink、Python、R、JDBC、Markdown 和 Shell。
2)丰富的Intecepter
Apache Zeppelin提供丰富的Intecepter,支持自定义Intecepter。集成Apache Spark、Flink等开源Intecepter组件,提供Spark、Flink等编程运行环境。
3)可视化图表生成及服务发布
Zeppelin支持饼状图、柱状图、折线图等可视化图表显示,
能够自动识别适于图表显示的数据处理结果,将数据进行统计图显示。
支持图表服务发布,操作步骤见下图链接。将图表发布成Web服务,能够通过浏览器访问或者利用iframe标签进行页面集成。
image.png
4)定时任务
定时任务需要配置cron参数并重启Zeppelin服务。在notebook页面进行cron表达式配置,定时任务实现步骤见上图链接。
参考:
[1] Apache Zeppelin官网
[2] Zeppelin交互式分析/分析的可视化
[3] 大数据分析工程师入门11-Hue&Zeppelin