担心的事终会发生-记忆中的“七二一”大暴雨
那天是2012年7月21日,因为“七二一”大暴雨而载入北京城历史的一天。晚上八点半,我开车出了门,路上已经没有多少行人,雨水漫延在马路上,晃动着一圈圈的灯光。
来到中关村软件园的南门,整个园区黑乎乎的像一片没有完工的工地,显得非常的安静。只有门口的岗亭亮着光,门卫向我挥挥手,喊道:“车不能进了”。于是,我就在路边停了车,打着伞,走进软件园。
越往里走,路面的积水越多,在昏黄的路灯下,显得特别混浊。顺着流动的方向,在马路边缘,有一个个小小的漩涡,那是有雨水井盖的地方。再往里走,漩涡已经不太能见到,反而看到水从路边涌出,散发着一股下水道的臭味。
水面刚到我的膝盖。因为担心有井盖被冲走而踩空,我开始沿着马路中间相对高出的路面,走向我们的办公楼。
走近大厦发现,原来地下一层的玻璃天井那里完全被淹没,哗哗往下漏水。在前台看到两位年轻的同事,坐在沙发上,告诉我说,下午过来打乒乓球,结果打完发现雨那么大,被困在这里了。问我回办公室干嘛,我说听说机房淹了,过来看看情况。
电梯自然已经不能用,顺着楼梯抹黑走到地下一层,积水大约有50公分,还好地下车库并没有车被淹。因为雨势太急,也有不少雨水从车库的坡道流下来。我打电话找到负责电力和设备维修的同事Xin,一同进入主机房查看。
这个主机房真的是“主机”房,里面放置的是我们做软件研发使用的IBM z系列大型机。这种大型机的可靠性非常高,正常运转很少出问题,被广泛应用在金融机构支撑核心业务。但是这种复杂的大型机器也有脆弱的一面,就是不停机的时候能够非常稳定可靠的运转;但是如果人为停机之后再启动,难免会有一些小的故障。所以这种机器要尽量避免冷启动。
机房里可以看到水面已经和高架地板持平,地板以下的强弱电线路已经都被淹没,还差10公分,就会淹到机器,造成物理损伤。此时机器都早已经都被远程关闭。我看到一台机器后面的地板被挪开,担心有人踩空,正想弯腰把它放好,Xin立刻制止了我,说:“小心触电”。这时候我才注意到,Xin穿着绝缘胶鞋,一副专业电工的样子;而我穿着短裤和沙滩鞋,大咧咧的涉水而来,反而显得有点儿奇怪。
机房门口已经用沙袋垒起,机房外的水位还是高于机房内,所以雨水还在不断往里渗流。Xin说现在溢入往机房水流量已经小多了,咱们关上门之后,水被阻挡会更慢一些。于是,我们从机房退了出来把门关上。整个地下一层的水,已经不再增长,物业的人正在组织往外抽水,我见到了物业负责人,要求他们确保主机房的水面不再升高,留了联系电话,然后回到一层。
这时候雨下得小了很多,地面的积水比我来的时候少一些了,我知道机房应该不会出什么大问题,于是与Xin告别。两位年轻同事还在前台,这个时候完全叫不到车;两人跟我一起走出软件园,搭车去地铁站。
后来才知道当天的大暴雨给北京造成的生命财产损失有多大,相比之下我们的机房被淹看起来微不足道。然而,任何事件的发生并非没有预见,只是我们当初考虑的情境会很大的影响当时的决策。记得那时候是2006年,我们正在软件园新建这个办公地点并决定建设大型主机机房。由于我们人员的快速增长和租用空间的限制,只好把机房选址在地下一层。按照信息安全风险管理的最佳实践,显然这个选择大大增加了风险。尽管我们认为北京发生水灾的概率很低,但是我们低估了城市排水设施的能力。最终,我们在6年前担心的事情,就在2012年发生了,现在想来正好验证了墨菲定律。侥幸的是,雨小了之后水位没有再增长,避免了巨大损失。后来我们也在门口修筑了防水堤,作为预防和进一步降低风险的措施。
现在看看每到汛期之前,在地铁、地下车库等地准备好的防汛物资,看到立交桥下的雨水警戒线和标注井盖的位置,在大雨来临时提前安排的值守,都说明了一个城市的成长。然而这个成长却有很大的代价,很多道理我们事先都懂,这些代价难道是真的不可避免的吗?