为什么是DataOps?
处在互联网行业的人都知道,从海量数据里我们可以挖掘出大量有价值的信息,然而在运维行业
,我们知道,已经或者正在经历手工运维
、自动化运维
、平台化运维
、DevOps
甚至所谓的SRE
理念阶段,但是随着运维行业的低效益化
和运维对象的海量化
扩张,以稳定性、效率、质量、成本
为目标的运维行业变得越来越复杂且难以管理。
也许有人会说,下一个时代就是AIOps
,通过使用AI
或机器人相关技术来实施运维,的确通过AI
或机器人
相关技术,的确能很好的解决当前我们运维中遇到的挑战,我们搞运维的都知道,在运维操作
过程中,机器远比人要靠谱的多,这也就是我们为什么要使用各种运维工具或平台来辅助运维了,而AI
相关技术如果成熟了正好可以替代一部分人,不仅在稳定性、效率、质量
上可以提供很多,而且在成本
上也可以优化不少,我们都知道,在互联网行业,人才的成本也是相当可观的。
然而,理想很丰满,现实却很骨干。企业内部如何实施AIOps
将会是一个很大的问题,而且能否成功实施AIOps
又是另外一个悬而未决的问题。我们搞运维的都知道,当年为了搞自动化运维
,我们在实施标准化
过程中也投入不少,但至今,我相信没有一个企业可以说他们生产环境是百分百的标准化的,而在DevOps
过程中,成功实施DevOps
的估计也寥寥无几。而且最重要的是,我们发现,2018年被大家热捧的AI
行业,人才成本更是高到不可想象,很多垂直领域的解决方案离正式的大众商用仍有一段时间的距离。
我们都知道未来已来,而且AI
是一个不可避免的时代,那作为运维行业,我们要如何做呢?我们都知道,不论人工智能还是机器人,在决策和实施的背后都是需要通过海量数据分析来进行支撑的,而且是要以当前的互联网技术作为基础的。在过去的十多年里,我们基于互联网技术构建了各种运维工具和系统,从手工运维
到自动化运维
再到平台化运维
以及DevOps运维
,我们不断优化运维过程,为了实现运维目标,我们构建了若干系统来支撑,也就是说,我们当前已经具备了智能化运维的基础技术平台,然而我所了解到的大部分企业并没有将内部运维相关系统的数据像企业内部业务系统数据那样进行分析挖掘处理,如果在这个阶段直接进行AIOps
的转型,即使领域内的AI
比较成功,但我相信AIOps
的整个过程也依然不会理想。
因此,以我个人观点来看,在运维基础技术平台
已经趋于完善时,我们需要对运维数据
进行挖掘分析,以数据来驱动运维决策和执行,也就是DataOps
,同时投入部分精力来研究AIOps
,待整个AI
行业趋于成熟之际,再结合内部完善的DataOps
运维体系,来真正实现以数据驱动的人工智能运维,也就是AIOps
。
在互联网行业,任何一家高度数字化和技术驱动的公司,都会非常重视数据价值的挖掘,通过各种数据分析挖掘手段,为公司发展决策和业务开展提供数据支持。
DataOps
其实就是通过使用数据分析挖掘手段对内部海量的运维数据进行集中分析处理,从而为运维平台以及管理者提供决策的运维方式。通常情况下,一套完整的解决方案由数据仓库+各种数据平台
的方式实现。其中数据仓库整合各个运维系统的数据,消灭数据孤岛
,各种数据平台拥有不同的特色和定位,例如:容量管理平台、报表平台、专业数据分析平台等,满足各类数据分析挖掘需求。