程序员

关于运维工程师的一些见解

2018-12-03  本文已影响38人  落叶飘飘花凋零

说实话,之前并没有将计算机体系纳入我的写作范围的打算。

虽然我从事计算机行业多年,对计算机行业也算有一些自己的见解,且偶尔也会写写技术文档。

但我一直都觉得,计算机思维与文学思维是属于两种思想的东西,不可混为一谈。

不过,后来想想,有些体会还是拿笔写下来好一些,不说是给别人带来些什么吧,只是想记住偶尔灵光一闪的体会,留到日后细细品味。

这里的话,就说说我对运维这个职位的见解吧。

实际上,一开始的时候,我和很多人一样,并没有运维这个概念。

什么是运维?

当别人问起来的时候,我是一脸懵逼的。

后来,偶尔有闲暇的时候,我都会去思考这个问题“运维是什么?什么是运维?怎么做好一个运维?”,于是,慢慢地,对于运维我有了一些自己的看法。

运维是什么?

在我看来,它是一个贯穿整个计算机体系,从最底层硬件到上层软件应用层都存在它影子的职业。

为什么这么说?

因为在我看来,无论是底层的硬件维护,机房运维,还是往上软件层次的桌面运维,系统管理员,以及监控组,运维工程师,运维开发,他们都属于运维。

所以,再次回到那个问题,运维是什么?

运维就是维护计算机体系,保证计算机体系可以正常稳定且安全运行的一群人。

这时候很多人都会说,那不就是修机吗?

没错,是修机,桌面运维修普通电脑,系统管理员修ERP,机房运维修服务器。

但运维仅仅只是修机吗?不,不是的,如果只是修机就可以称之为运维的话,那它也不可能自立一个体系,称之为一个职业了。

在我看来,修机只是最低层的运维,只是运维工作的一部分。

实际上,一个合格的运维是需要做到走在错误发生之前的。

什么叫走在错误发生之前?

比如说,在你的电脑即将崩溃之前,这边已经通过软件检测到你CPU温度过高而提前给你加了散热硅胶。

“运维,运维,以预防为主!”

这是我一直坚信的理念,运维是需要在错误可能出现之前,就能估算到它出现的可能性,并提供足够的预备方案,保证哪怕出现了这个错误,也不会影响计算机体系的正常运行。

所以,我们再次回到那个运维的宗旨,保证计算机体系正常稳定且安全地运行。

怎样才能保证计算机体系正常稳定且安全地运行?

难道仅仅是靠出了问题的时候去维修吗?不,那样可不是运维,那是救火队员。

运维真正要做的是做合理的规划,建立规范的体系,提供足量的应急方案,然后在此基础上对整个计算机体系进行合理的优化,性能的改进,安全性的提升。

反正不管是用什么手段,通俗一点来讲,就是尽你所能,保证你要维护的电脑(不管是普通电脑还是服务器),一年365天都不出问题。

当然这里所说的不出问题,指的不是电脑本身不出问题,而是理论上的不出问题,指的主要是出了问题,也能有解决方案,把损失降到最小。

就像为了防止ERP服务器出问题而影响分院业务,所以我需要搭建双机热备和负载均衡机制,而为了防止服务器性能过高,导致服务器崩溃,我需要搭zabbix做服务器监控并配置性能过高报警。

时间损耗产生的损失才是最大的损失,而如何能预防问题的出现,并提供预备方案在问题出现的时候能迅速解决,这是身为一个运维人员最主要的工作。

以上,就是我理解中的运维!

上一篇下一篇

猜你喜欢

热点阅读