数据可观测性-架构设计

2022-02-19  本文已影响0人  和心数据

整体架构

DataVines 是一个数据可观测性系统,旨在帮助企业减少“数据宕机时间”,帮助企业能够在数据错误导致损失之前及时发现数据错误,它具有数据目录管理、数据质量监控和SLAs等功能。下面是它的架构设计图:

DataVines架构图

组件详解

Coordinator

Coordinator是DataVines平台核心协调者,负责对外提供API、调度各种数据监控任务,分发到Executor中去执行


Coordinator.

主要功能

高可用设计

Executor

Executor 是系统中实际负责运行任务的服务,会将Coordinator所下发的任务根据参数配置去运行。


Executor

主要功能

Engine

本平台中所执行的各种监控任务本质上是去读取指定的数据源上的数据根据所配置好的脚本执行各种聚合统计运算,最后将执行结果写到存储引擎中用于各种判断。那么这样的任务可以是Spark任务、也可以是Flink任务,或者直接使用jdbc去运行都可以。因此将执行引擎抽象出来做了Engine的设计,支持Engine的插件化,用户可以使用平台内部已经实现的计算引擎,也可以根据自己的需求添加新的Engine来执行任务

MetaDataCrawler

MetaDataCrawler 主要负责定时去抓取指定数据源的元数据信息,然后更新到元数据存储引擎中

AlertServer

AlertServer 主要负责告警,用户在平台上配置告警规则,一旦数据监控任务触发告警,那么AlertServer就会将报错信息发送到指定的平台上,例如邮箱,企业微信等

核心设计

插件化设计

Connector插件化设计

Metric插件化设计

Engine插件化设计

流程设计

任务执行流程

任务执行流程

数据监控参数生成流程

参数的构造和转换流程

未完待续。。。

上一篇 下一篇

猜你喜欢

热点阅读