分享一个运维监控大屏看板
基于AIOps理念研发的新一代运维监控大屏,全盘展示IT运行状态,减轻运维人员的重复性工作量,提高IT系统排错速度,加速运维知识学习积累。
![](https://img.haomeiwen.com/i12421489/b34b215312444601.png)
一、监控大屏主要由九个板块构成:网格、资产类型分布、应用系统、拓扑图、告警情况、告警分布、网络风险状况、数据备份、机房动环。
- 网格
可将一个或多个资产归为一个网格,并可查看相应配置项的监控数据及根据配置好的自动运维提示相应警告信息等。
![](https://img.haomeiwen.com/i12421489/d29ea3a53ccccd08.png)
- 资产类型分布
对各分类资产占比进行展示,例如应用系统、MySQL、路由器等。
![](https://img.haomeiwen.com/i12421489/a24ce4b585e5a918.png)
- 应用系统
对资产状态进行展示,绿色表示正常,红色表示异常,同时也对连接时间、传输时间、总耗时进行展示。
![](https://img.haomeiwen.com/i12421489/3e686bd7aa1f9110.png)
- 拓扑图
把资产间的从属关系相对清晰的呈现出来,展示不同层次的节点和连接关系。
![](https://img.haomeiwen.com/i12421489/e69b7be9d1e2a349.png)
- 告警情况
对相应告警的资产划分级别,显示对应的告警IP、告警源及持续时间。
![](https://img.haomeiwen.com/i12421489/fa3447a78f76a4aa.png)
- 告警分布
可对资产的告警进行分类,分为一般告警、告警、灾难,按分类展示出各告警分类的数据占比。
![](https://img.haomeiwen.com/i12421489/541c4745b02adff9.png)
- 网络风险状况
可对网络安全风险的事件,例如病毒的侵袭、黑客的非法闯入、数据窃听和拦截等事件进行记录。
![](https://img.haomeiwen.com/i12421489/19881a426ac048c9.png)
- 数据备份
可以清楚的看到每一项资产的备份比例及存储的数据量,防止系统出现操作失误或系统故障时导致的数据丢失。
![](https://img.haomeiwen.com/i12421489/3ba924ba4619ec6b.png)
- 机房动环
机房动环系统,全称是机房动力环境监控系统,针对机房的构成,具备温湿度监控、漏水监控、电源监控、空调监控、配电柜监控等功能,提供自动化、智能化的管理,达到无人值守,高效管理的目的。
![](https://img.haomeiwen.com/i12421489/5b823c32af5a3c2c.png)
二、流量大屏
流量大屏主要展示各省之间流量的流入情况,以地图的方式展示,以此来表达各种数据信息,能更清晰、更有效率的处理繁琐的数据。
![](https://img.haomeiwen.com/i12421489/7067672d1ef6b4e5.png)
三、应用大屏主要由三个板块构成:状态及连接性能、应用可用率排行榜、应用可用率,从而实现高效运维和数字化监管。
![](https://img.haomeiwen.com/i12421489/33f74696f5324050.png)
- 状态及连接性能
对资产状态进行展示,同时也对连接时间、传输时间、总耗时进行展示分析,直观看出资产的每一项所耗时间,构建一个智能运维工作台。
![](https://img.haomeiwen.com/i12421489/e23eddc951ba2240.png)
- 应用可用率排行榜
可对资产的利用率进行对比,直观体现应用可用率的高低,从而提高资产的使用率,提高效率,节省运维时间。
![](https://img.haomeiwen.com/i12421489/f6926bada58b639e.png)
- 应用可用率
对资产的应用可用率进行展示,实现集中化管控,构建运维可视化中心。
![](https://img.haomeiwen.com/i12421489/8e8d665d74614470.png)
最终,提升数据容量预测准确率,提高资源利用率并对容量风险进行预警,实现数字化运维。
四、自动运维作业大屏主要由五个板块构成:作业分布情况、主机作业情况、网格作业排名、作业日志情况、作业执行情况。
![](https://img.haomeiwen.com/i12421489/85d42b50035f8316.png)
1.作业分布情况主要展示:作业的类型分布和方式分布。
![](https://img.haomeiwen.com/i12421489/c0eb2f74e89f4fc9.png)
2.主机作业情况主要展示:各主机的作业数量和各主机的异常数量。
![](https://img.haomeiwen.com/i12421489/6384831daa52d6d9.png)
3.网格作业排名主要展示:资产的作业情况排名,以及资产作业所占比的多少。
![](https://img.haomeiwen.com/i12421489/f42f072e2e08bd47.png)
4.作业日志情况展示各天的日志数量,并且以柱状图展示,各天的日志数量一目了然,提高了运维的效率。
![](https://img.haomeiwen.com/i12421489/298e2622bc7d375d.png)
5.作业执行情况主要展示:作业在执行情况中总的执行次数和作业过程中的异常次数。
![](https://img.haomeiwen.com/i12421489/1da26d8aa16ae1b4.png)
五、堡垒大屏主要由六个板块构成:登陆次数、资产登陆排行榜、登陆IP排行榜、登陆用户排行榜、操作指令、状态分类统计。
![](https://img.haomeiwen.com/i12421489/d6014d08e83ecdc6.png)
1.登陆次数主要展示每天访问次数的状态(下线、登陆失败、在线),以柱状图的方式进行展示,登陆次数一目了然。
![](https://img.haomeiwen.com/i12421489/1468e82a10f6167b.png)
2.资产登陆排行榜展示每个资产的登陆次数,并且在次数的基础上进行排名。
![](https://img.haomeiwen.com/i12421489/1a71509997487042.png)
3.登陆IP排行榜展示每个登陆IP的次数,并且在登陆次数的基础上进行排名。
![](https://img.haomeiwen.com/i12421489/71f244143d3ee92e.png)
4.登陆用户排行榜展示每个登陆用户的次数,并且在登陆次数的基础上进行排名。
![](https://img.haomeiwen.com/i12421489/777de8fef3d65b10.png)
5.操作指令的展示。
![](https://img.haomeiwen.com/i12421489/7af42ad97a3f6ac8.png)
6.状态分类统计:可对状态进行分类,分为失败、上线、在线,按分类展示出各状态的数据占比。
![](https://img.haomeiwen.com/i12421489/ce5abf0557d3c9ae.png)
六、三维可视化机房:3D 机房,机柜、服务器、端口实时监控 数据联动展示,机柜动态添加、服务器上下架,动力环境,数据可视化展示(温湿度云图,防盗门禁,配电,管线控制)、告警展示。
![](https://img.haomeiwen.com/i12421489/83e6716e3802e75d.png)
![](https://img.haomeiwen.com/i12421489/ed586019cb2726f3.png)
点击右上方的模拟告警设置按钮,可进入告警设置页面。
![](https://img.haomeiwen.com/i12421489/581d3f370a0abe3e.png)
告警设置页面可查看触发告警设置和解除告警设置的各设备明细。
![](https://img.haomeiwen.com/i12421489/e9f892a7599456b6.png)
三维数据可视化的意义:
1.实用性:直观快速的展示数据,提示告警,快速定位问题,为解决问题节省大量时间。
2.成本管理:三维可视化可以为高层领导者,执行者提供最快捷的管理方案。
3.去专业化:本着代码改变世界的愿望,可视化操控就是为了让更多的人能够看懂、操作所谓专业的东西。
4.科技:越是科技的东西,越需要直观的展示,越是复杂的东西越需要简单的描述。可视化恰恰解决了这个痛点。
5.体面:企业的数据大屏是企业的形象,三维可视化可快速提升企业高大上的企业形象,展示企业的实力与精致。
6.轻便:这是技术的实现方式,使用电脑浏览器 或者手机浏览器可直接查看三维机房,方便快捷。
![](https://img.haomeiwen.com/i12421489/a614d98df3ffcc0b.png)
七、报警大屏主要由六个板块构成:网格、报警词云、资产报警、报警态势 、报警等级分布、作业自动化报警。
![](https://img.haomeiwen.com/i12421489/02abbd11e6595908.png)
1.网格主要展示网格报警率、网格数、报警网格、游离资产,网格报警数量清晰明白。
![](https://img.haomeiwen.com/i12421489/eeb52ee910b61766.png)
2.报警词云的展示
![](https://img.haomeiwen.com/i12421489/81946b35544f5d1d.png)
3.资产报警主要展示:报警资产的报警时间、告警IP、告警源、告警内容、告警的级别、持续的时间,资产的告警状态展示清晰。
![](https://img.haomeiwen.com/i12421489/5a38064b3c4b9b36.png)
4.报警态势把报警分为警告、一般严重、严重、灾难、信息等,各天的报警信息清晰展示在态势图上,提高了运维的工作效率。
![](https://img.haomeiwen.com/i12421489/059e3cfd3f7b865c.png)
5.报警等级分布主要展示:报警总数、报警资产、维保到期资产,并对报警等级进行分类,分为警告、一般严重、严重、灾难、信息,按分类展示出各状态的数据占比。
![](https://img.haomeiwen.com/i12421489/f83fc7386b81ff42.png)
6.作业自动化报警主要展示:报警作业数、报警主机数,并按分类展示出各状态的数据占比。
![](https://img.haomeiwen.com/i12421489/8ad25d2c9f1a76f0.png)
八、报警信息主要由三个板块构成:资产报警、风险指令报警、作业报警。
![](https://img.haomeiwen.com/i12421489/3b05747baa4149e3.png)
1.资产报警主要展示:资产的报警时间、告警IP、告警源、告警内容、告警的级别、持续的时间,资产的告警状态展示清晰。
![](https://img.haomeiwen.com/i12421489/d16e3c76cc9e3f6b.png)
2.风险指令报警主要展示:报警时间、告警IP、责任人、风险等级、告警指令。
![](https://img.haomeiwen.com/i12421489/ed7a71aa2ba26b90.png)
3.作业报警主要展示:作业时间、作业ip、作业名称。
![](https://img.haomeiwen.com/i12421489/3d45a8c0c5d4de25.png)