校园信息服务故障的透明度

2017-05-20  本文已影响0人  phy25

本来这是一篇自己写的英语文章(所以吹水的时候更天马行空),想了想还是翻译回来了,顺便补充一些内容。

最近发生了些啥

最近在我的学校,信息服务挺不稳定的。

稍早前的网络简报提到的 DDoS 问题

为什么故障需要及时的透明

突然出了这么多情况,想必也是没人愿意,但它们的发生肯定是有原因的。不管怎么说吧,除了解决问题本身之外,让解决问题的过程透明也很重要。为什么呢?

现今信息技术正在成为生活中不可或缺的一部分,像供水和供电一样,变成了一种基础设施。这时候它已经一点也不“高级”了,人们对其的期望也会很高。另外,信息技术也还在高速发展(发展的速度按年算,而不是十几年),人们的期望也跟着这个速度在涨。这就对所有的信息技术服务者提出了很高的挑战,包括校园的信息部门。

这时候,或许他们在努力,但如果他们不及时说出来,有些人就会觉得“你们服务这么差,我正急着呢,你们还不努力”。两者的认识之间就形成了代沟。即便后来信息服务的问题解决了,别人的气头也过去了,你再怎么解释,效果也没有当时解释来得好。

“你们怎么一个月都修不好个扶梯,XX组走了没”

P.S. 有个好人提醒过我说,有时候体制里会有那种不干活的人。不过我觉得我的校区里的那些人还挺努力的。

如果信息服务的透明不够及时的话,还会有另一个问题:用户不知道他们是该打电话(那时候客服电话总会被打爆)还是该等。实际上大多数人是只会抱怨两句然后静静等修复的,并不会去报障——毕竟大家都很忙嘛,对吧?但是如果服务者就根本不知道这个问题存在呢?我们不知道他们知不知道有问题,而大多数人是不会无限地信任别人,认为“他们肯定在修了”。这样的情况如果持续发生,肯定会导致用户的不满意。

我想不到主动、及时的透明对一个努力工作的公共服务有什么坏处,所以我相信这件事情是应该做的。

对了,我还得强调一下,这里的透明是“及时的透明”。有时候这会带来个问题:当你发现之前你发现的故障并不是那个已经公布的原因的时候,你可能得“打脸”一下。只要每个人都很聪明,知道每个人都会犯错误,这其实并不是太大的问题,你只要把之前说错的话留在那里就好了。

在 Staytus 软件的演示里,有个问题从已解决又回到了故障的状态

工具和平台要有,但并没那么重要

有人可能会说,没有合适的工具来做这个事情。可能现在的工具没那么合适,但当你有想把事情做好的想法的时候,工具和平台并不是个问题。

在我的学校里有个很好的例子。学生资助中心一直在用论坛的方式来回答学生对发钱的疑问。尽管他们选的论坛没那么热门,我还觉得里面一些奖学金发放的进度帖子可以整理在同一个页面里,但是他们首先有了透明的主意,还做得很好。

信息服务跟这个比起来,还是有自己的特点的:

要做到透明,用数字的方式可能会更好一些。

不过数字的方式,要做到不故障也需要功夫。我们可以把这个东西放在学校不容易故障的服务器上,而且内外网都要连。更好的解决方案则是:准备一个第三方(公网的 VPS)或者公共的服务(微博微信),然后认为我们故障的时候,他们不故障。听起来不大靠谱,不过要是大家都坏了,那就是中彩票了(估计五十年一遇吧),到那时候你肯定会迫不及待地去做“线下”的通知了。

嗯,只有线下通知可能还不够呢……

一个给信息服务准备的解决方案

搞信息服务的人其实也很忙的,这种时候客服不能只依赖于“我找你,然后你告诉我怎么回事”的模式。这时候可以引入一些自助服务的概念:把故障时的进度更新公开给每个人。当需要帮助的时候,我们自己看一下进度,就知道大概怎么回事,就能放心地等了。

其实我听说在线报修这个东西已经在找厂家做了,不过我觉得现在更有用的还是这个“状态页面”。

提到平台,我们一个一个来看吧。

上面提到说,故障发生的时候,用户是有想法自己去查服务状态的。所以可以搞一个发布频繁、及时更新、没必要“推送”通知给每一个人的服务状态页面。

结论就是,可以搞一个:

“怎么发布”也很简单:可以提前制定几条说明的模板(比如用很流行的 investgating/identified/monitoring/resolved 模式),发布的时候再往模板里补充详细信息就好。也可以规定一些信息发布的规则,比如在故障发生时,至少每多少小时发布一次信息。

Google 的服务状态页面上,信息都是预先翻译好的模板,注意那句“我们有附加的英文信息”

我们还得有个人来做发布这件事情(我知道在中国大陆还是挺难的),或许得招个“technical writer”。不过我觉得在学校这个可以靠勤工俭学的学生来解决:他们先签个保密协议之类的东西,然后加到信息部门老师们的工作群里,平时静静不说话,如果出了故障,他就负责看群里的消息,然后套模板发状态更新。的确工作群里有些东西可能不大适合公开,所以说保密还是很重要的嘛。

当然了,如果老师们自己能在保证频率的情况下,自己发状态更新,也挺好的(不过他们也挺忙的)。

Staytus 的发布界面

选一个开源的解决方案

作为一个“没什么钱”的学生,自然会很喜欢折腾开源的东西。在状态页面这个东西上,自然也可以看看能不能用开源来解决。

我研究了一下,国内还是没有这类公共的“状态页面”的服务。比如说 Leancloud 自己做了状态页面。用这类服务的“国际版”也不是很好,毕竟可能会慢。所以我们除了找厂家,就只能自己搭咯。

我觉得吧,校园信息服务的状态页面最重要的东西是“更新”。总体的服务状态的红绿标识倒没那么重要。

对的,苹果这样子不大适合我们

研究了一下之后,我觉得能用的动态的、活跃维护的开源解决方案也没那么多。

Cachet(开发版)

我知道有些人挺讨厌数据库的,所以也有用静态页面生成的方案。这些方案有是有,但他们还没那么完美,整套工作流程形成起来也不是那么容易。

一点微小的工作

假如有这样一个页面的话,效果是下面这个样子的(注:图中的时间均为根据资料模拟的,不是官方消息,更不是准确时间!)

Staytus 首页示例 Staytus 计费故障示例 Staytus 校园卡故障示例 Staytus 维护示例
上一篇 下一篇

猜你喜欢

热点阅读