是时候拥有一套企业专属的IT运维管理软件了

2017-11-28  本文已影响50人  ServiceHot

IT管理包含了很多内容,信息化、网络安全、各种IT项目,运维、服务、支持都需要投入,说白了,要老板的认可和支持,不然,别说钱,人都得GUN。但往往会有很多的IT经理抱怨,天天忙得跟兔子似的,老板还觉得你没用,想上什么项目,争取点预算比登天还难。

多年前一朋友和我说过一事儿,朋友大学毕业去了宅急送做IT运维,没事儿就喜欢各个业务部门瞎转悠,一日被一其他部门大领导看到,挨骂了“天天没个P事儿,你瞎转悠啥!”,朋友很机智幽默,淡淡的回了句“如果我天天忙得上厕所都没时间,你们就可以不用上班了”。朋友这事儿反应了大部分中小企业IT管理的现状,忙挨骂,不忙更挨骂,里外不讨好。

这种情况很多搞IT的同胞可能都遇到过,当然也是出于多数人对IT管理这个概念似乎并不是那么的熟悉,而中小企业IT管理者的这种“非人”现状也不全是因为老板不认可信息化,业务部门不配合信息化这些原因造成的,反而有相当部分的原因是IT管理制度或者管理软件本身的是否存在,或者功能是否存在缺失引起的。

下面我们就由表及里地给大家阐述一下产生这些问题的原因以及解决的方向:

诊:

1、无法统一协调,导致问题不能及时解决

随着国家大部委制的整合进程逐渐加快,问题暴露得更加明显。原本独立的两套IT系统,现在要完成协同办公,多部门统一协调管理则面临不小的挑战。当两个部委在业务流程上有重合时,就难免发生推卸责任,纠缠不清的扯皮事件。诸如不能上网这样的简单问题,很可能会牵涉到几个部门之间配合。而问题出现时,A部门找B部门反馈,B部门又找C部门处理,C可能说是D部门的问题;信息中心主任找科长,科长找科员,科员找支持,这样导致很简单的问题无法得到及时有效的处理,影响的不仅仅是业务本身,部门之间也会怨声载道。

问题不仅在政府行业中出现,很多企业也会面临。根本原因是各部门之间无法形成统一协调的IT系统管理,问题得不到有效的跟踪,也就谈不上及时解决。现在,如何实现各部门之间的统一协调,以及如何对问题进行有效的跟踪和量化的管理已经成为政府和企业不得不着手解决的难题。

2、原因不清,导致问题无法根治

如果说统一协调管理问题不得不解决,那么当IT系统的某个流程出现问题时,往往因为找不到故障原因,而无法从根本解决问题的情况,却成为企业很难解决的问题。举个最简单的例子,当员工反应上网速度变慢时,网络运维人员查找了半天问题,也许会想到非法流量占用带宽,但网络中的应用繁多,哪种应用才是罪魁祸首?无法判断哪些P2P是正常应用,哪些是非法应用?到底是外来攻击造成的安全问题还是确实该增加带宽?这种情况对于缺乏管理工具的IT部门来说,很难找到答案。就算是对网络应用进行优化,但没有相应的监控和分析工具,该对什么进行优化又衍生了新问题。

问题原因不清,给许多企业带来不小的麻烦。这使网络运维人员疲于奔波,却始终解决不了问题,挨累不讨好的事情令他们叫苦不迭。更为重要的是,因为找不到病根儿而导致问题无法根治,才是企业IT部门最为头痛和急需解决的事情。

3、对人的依赖,导致人员变更后的运维问题

在网络运维管理中,人的因素成为企业急需解决的第三个问题。有人会问,为什么是人呢?我们都清楚的知道人可以解决问题,这是人在网络运维管理中起到的重要作用,也是无须质疑的。但问题也同样随之而来,如果一个熟练运维人员的岗位发生变更,当问题在出现时,就很难得到迅速处理。即使会有新人继承前人的工作,但他却无法继承前人的运维经验,这成为企业运维成本增加,重复投资的重要原因。

对人的依赖越大,网络管理中的不稳定因素就越多。在企业的IT系统中,如何减少对人的依赖,避免出现因人员变更导致运维无法有效进行,是企业IT部门面临的重大考验。

上述三个问题存在一个共同点,那就是人与网络运维管理之间的关系,或者说人在网络运维管理中起到的作用能否被量化和标准化,将决定这三个问题能否得到根本的解决。事实上,通过运维管理工具,可以跟踪事件的流程,实现整个IT系统的统一与协调;通过运维管理工具,帮助运维人员监控和定位问题根源;通过知识库的积累可以有效解决人员变更后的管理问题。可以说,IT系统不仅仅需要人的运维,为了发挥IT系统的最大作用,利用工具来量化、标准化管理,已经成为企业网络管理的一个趋势,这是符合客观发展规律的。

那么也许有人会说,我们很多年前就已经利用工具来管理网络和IT系统了!没错,这是事实,但前面提到三个急需解决的问题,恰恰是在已经部署网管系统的政府部门或企业中发生的,他们的IT基础设施相对比较完善,也部署了相关的管理工具,但问题还是有,依然无法保障IT系统的发挥最大的作用,甚至影响到业务流程。为什么会出现这种情况呢?Servicehot认为,根本原因在于IT服务部门没有真正的从成本中心向价值中心转变。

IT部门不能只停留在日常的支持运维水平,不能局限于企业中的一个封闭部门,必须使IT部门适应公司其他业务部门的需求,以服务流程为驱动,以服务交付为核心,沟通和连接企业的业务与技术平台,只有这样才能从根本上解决上述问题。

治:

1、统一的运行展现:可以给运维管理人员提供网络管理、业务应用管理、机房环境等资源监控系统的集中展现与处理平台,这即方便运维人员操作,也解决了IT系统的统一协调问题;

2、问题的管理功能:可以帮助运维人员查明突发事件或错误产生的根本原因,并制定解决问题的方案和防止错误再次发生的有效措施;

3、变更的管理:通过分析、计划、执行和回顾四个阶段,最大限度控制变更的风险,保持企业IT部门和客户之间的信息沟通,这不但降低了对人的依赖,而且还实现了运维的量化、标准化管理;

4、符合ITIL管理理念中的知识库:通过知识提交、审核、发布,以及查询等功能自动积累IT部门的日常运维的工作经验,从而帮助各级支持人员提高技能水平,简化IT服务认为,也最大程度的降低了对具体个人的依赖。

一款好的IT运维管理软件能为您带来什么?

这些问题的答案听上去很复杂,但是一款好的管理软件就可以解决上述所有问题,例如Servicehot 的ITSOM IT服务运营管理平台。细致一点说,它能做到以下几点:

一、运行/维护

1、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控  应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

2、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

3、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理 ,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators);

4、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

5、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

6、信息安全管理:该部分包含了许多方面的内容,信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127种控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

7、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。

二、服务/支持

该阶段主要为IT部门的运维人员向其它人员(内部和外部)提供服务与支持,内容主要包括用户投诉与申告的及时响应与处理,系统故障发现、通知、分派、监督、解决、回馈流程的闭环方式管理。该部分的实现会极大提高IT部门的服务意识和服务水平、规范服务与技术支持的流程,该部分与优化/变更阶段的分界线是 IT部门服务水平的考核是否能够满足业务部门或客户的要求,如果现有IT系统已经不能满足要求,则进入优化和变更阶段。

三、优化/变更

该部分指IT部门在IT系统、业务应用、软件开发的建设阶段结束,进入运营阶段后对系统优化、软件升级、设备配置和管理策略变更进行的管理。

1、变更管理:主要用于建立合理、科学、规范的变更流程管理,包括立项/变更申请、审批、执行、数据和版本的一致性和连续性保持等。

2、服务水平管理:通过定义服务水平协议,并利用相应监控手段、或模拟用户行为以及用户体验追踪等方式考核IT部门为业务部门或客户提供的服务,并根据考核结果评价IT部门的运维工作情况,评估IT系统是否需要改造或替换。

3、性能/响应管理:采集IT和业务系统的性能数据,定位系统性能瓶颈,诊断系统性能下降或不稳定原因,分析系统运行历史数据,推断系统运行趋势。

能做到做好做实这些并不容易,但虽然面临挑战,可以肯定的是,利用IT运维管理系统来支持IT系统的运维与管理是必然的结果,是解放生产力的具体表现,这符合事物的客观规律。总之,IT服务管理本身就是一套异常负责的学科,只有在实践中不断摸索,才能完善自身的发展,网络运维管理工具也必将不断提升IT系统的治理水平,从而转化成企业的核心竞争力。

上一篇下一篇

猜你喜欢

热点阅读