大数据运维及安全

转载|运维平台一体化

2017-08-01  本文已影响202人  大数据之心

作者:彭华盛,微信订阅号:HuashengPeng001


运维之路二维码

本专题对该文进行了重新排版和重点标注。

3月底有幸参加了全球云计算开源大会,并作了一个关于《运维一体之平台一体化》的分享,现将PPT的内容整理成文。
『运维一体化 之 平台一体化』 ---- 从标题看可以看到两个一体化,分别是运维一体化与平台一体化。运维一体化是数据中心的运营体系,包括:人员组织一体化、流程一体化、平台一体化三方面,其中平台一体化偏向于运维工具与自动化方面的建设。(平台一体化涉及的内容比较多,本文以30分钟来摘几个重点来分享)

转型

和目前大部份运维团队一样,我们的运维团队也打着“救火”、“背锅”、“低价值”等标签,团队的特点归纳下有四个特点:

针对上面四个特点我们提出了四个转型:

在现有人力维持不变,运维质量要求不断提升的背景下,为实现上述面四个转型目标,我们认为首先要解放生产力,因为没有人什么都转型都实现不了。解决生产力当前最主要的手段还需靠自动化,所以下面再说说我们自动化方面遇到的3个困难:

针对上面提到的四个转型目标,以及自动化目前遇到的困难,我们制定了相关的技术及管理的改进方案:运维一体化。

一体化

在讲一体化思路前,我先讲讲促进一体化思路形成的一些思路来源:

《架构即未来》这本书里提到的组织、流程、架构的三位一体和我们运维一体化很吻合;
腾讯蓝鲸、云霁科技在运维自动化方面的整体解决方案引导着我制定平台一体化的方案;
googlesre高逼格的运维运营模式,促进我在运维开发方面的解决思路形成;

运维一体化

如上图所示,我们的运维一体化的核心是组织、流程、工具三位一体,具体来讲是以CMDB为基础,结合运维统一门户、运维分析平台、云平台、监控平台、流程平台、操作平台、审计归档平台,构建运维工具一体化(即平台一体化),并在工具一体化的同时,结合流程一体化,最终构建组织、流程、工具三位一体的运营一体化的运营体系。运维一体化以运维向主动精细化运维、价值驱动、运维开发、智能化转型为目标,为实现上述目标首要的工作是需要解放运维生产力,通过“监管控”运维自动化提高工作效率,通过自主的开发平台实现敏捷的开发能力,通过运维分析实现运维智能化,辅助运维决策。

平台一体化

再重点讲讲分享的重点:平台一体化,平台一体化的思路是:6平台 +1门户+ 4原则。

通过归纳这个6平台+1门户+4原则的平台一体化思路,并将这个思路推广到数据中心工具建设团队中,使我们能否快速达成共识,提高协作效率。

下面这张PPT是对平台一体化的进一步细化,概括了目前平台一体化中的主要内容,各位有兴趣可以花时间看看。


平台一体化

建设原则

平台一体化规划重点解决各技术平台间的信息互联互通、统一展现和紧密联动,对于各个平台工具有着几个原则“服务化、可视化、自主化、工具化”,即:

下面对这4个原则,结合我们目前工具建设阶段性的成效来做进一步的分享。

原则1:自主化

自主化包括开发能力自主化与架构自主化。

架构自主化

原则2:工具化

我们将工具分为重量型工具和轻量型工具,大致以这个思路区分:

对于这两类工具,我们综合人员能力、投入产出等客观因素求个平衡点,其中重量型工具以引入成熟系统进行二次开发为主,轻量型工具逐步以自主开发工具为主。
下面针对上面两类工具分别举例。
首先是重量型工具,以集中监控为例,监控架构见这张PPT。

监控架构

集中监控的建设思路主要是以“不漏报、不误报”加强“监”的能力,通过监控分析、学习能力补充自动化“控”的能力,实现智能化的主动预测、故障自愈、无人值守。目前我们的监控体系己覆盖从基础设施、服务器存储、系统软件(含虚拟化、容器、系统软件等)、应用可用性、客户体验五个层次的对象,这些监控对像由不同的监控工具实现监控数据的采集与事件分析。在监控工具之上,由集中监控实现监控数据整合、事件整合、子系统接入、统一可视化、数据源采集、智能学习、智能基线、事件协同处理、事件联动分析、新技术平台监控等平台能力。后续需要在平台能力之上建立智能学习型监控,实现主动预测故障、故障自愈、无人值守。

讲完重量型工具,现在举例讲讲轻型工具,下面这张应用工厂的界面可以很好的解释我们的建设思路。参考APPSTORE,在团队中建立工具开发文化,管理员可以开发工具,并发布到应用工厂并供其它管理员使用,其它管理员可以对工具提建议或打分,这些打分可以作为该工具欢迎度进行奖励
以轻量型工具中的服务启停为例,这个工具可以满足关机维护、应用投产、故障应急等场景,支持单个或多个服务的环境保存、进程常规情况下的启停、异常情况下启停、启停后多重形式的检查方法。
这些小工具的建设一方面提高了团队运维工作效率与标准化的落实,另一方面也有助于一些有想法、有能力的同事增加工作成就感。

原则3:服务化

服务化是为了实现工具间通讯的互联互通,服务化一方面要求各工具对外提供API接口;另一方面是通过统一开发一个服务集成模块实现工具监控API接口的注册、发现、鉴权。
这个服务集成有2个主要功能:

这个服务集成还提供多种通讯方式,RPC、MQ队列等,可根据不同的通讯需要进行调用。

原则4: 可视化

可视化方面我们主要以统一门户为载体,在技术上我们选择了以H5加CSS3(为移动端化作准备),提供以下3个特性:

在功能上,我们提供多种用户视角,专业团队视图、管理视图、业务视图,下在这张界面是我们统一门户待办的视图,它将不同用户角色所关心的指标集中在这个视图,作为用户控制台。
接下来还将继续做好自动化,解决工作上的痛点,解放生产力,后续再结合大数据去放眼智能运维。

上一篇 下一篇

猜你喜欢

热点阅读