亲历惊心48小时抢救35亿交易数据(2)

时间:2008-11-29   来源:   网友评论:0   人气: 498 作者:

    实在是我们的误操作愚蠢得太不可原谅,最后IBM的7位工程师也不敢贸然给出任何的动作和建议,唯一的举措就是将现场情况抓图整理,上传给2线。希望有人在线,能有解决的办法……

    然后,IBM的工程师也走了……

紧急预案,又出节外生枝

    与此同时,客户方也临时召开紧急会议,经讨论后给我们公布了他们的紧急预案措施:冻结原有的业务存储系统DS4300,连夜在新的存储系统DS4800上做RAID,建Volumn Group,将所有应用和数据转移,先让系统跑起来,数据再说。于是,大家纷纷给家人电话或者短信“今晚通宵加班,我不回去了。“

    这时回到那两台为了配置它们而闯祸的DS4800面前,它们却吓得再不敢抬眼看我们,死活就是不和我们的管理系统连接。。。。气得我•##¥%……—

    客户算是有水平了,并没有在这个时候追究责任。而是让我们去处理问题,如果这个问题都没处理好。那,那。。。。。

    看来连DS4800也指望不上的时候,一直在一边帮助客户协调跑前跑后的我们公司的销售经理突然对我说:“你跑一趟,和XXX联系,这是电话,拉一台DS4300回来,再带6块300G的硬盘,就对他说是X总叫你来取的。”我当时那个乐啊!赶紧屁颠屁颠的就打车过去了(那时都半夜了)。到了销售说的地方,领到机器,也顾不得新洗的白衣服了,和司机、库管一起把机器扛到了车上。

    车刚要发动返回客户现场,就收到销售的短信:硬盘拿了么?车还没开到客户大门,老远就看见销售在门口蹲着等着了……所有的人都在期待这台DS4300,但是,新拉来的DS4300却没有接上……

    原来,在场的人七手八脚的把这台救命稻草DS4300抬上楼,打开箱子一瞅,乐了。原来打算用6块300G的硬盘做临时空间有点紧张,只能做RAID5,不能做hotspare,没想到上面整整齐齐的插着7块146G的硬盘,再加上6块300G硬盘,嘿,这下够了!

    销售在这个时候还不忘打趣:“慢点慢点,这可是咱们的最后一棵救命稻草,有了它我就算是有了一条活路,没它我就得从这窗户口跳下去了。嘿嘿。。”要知道,当时我们可是在19层的机房啊。

    上好架,通上电,开始练。第一个分区100G,ok!第二个分区,400G,咦?怎么出错了?

    再来一遍还是不行!这时候,一直镇定的,老练的,不懂技术的销售一直直勾勾瞅着屏幕,憋不住了问一句:“这是怎么回事?”操刀的哥们没有回答,让我把某一块盘拔出来,等一下再插上……故障依旧,关掉再开盘柜……故障还是依旧……

柳暗花明,35亿交易数据失而复得

    销售看不下去了,但是毕竟好涵养,压了压焦虑的心情,拉我到外面抽烟去了。烟雾缭绕中,给我讲了上次误操作将一所大学的学籍档案全部删除的事情……。最后,掐灭了烟头:“走,回去看看!”

    回到机房,RAID居然已经做好了。问了我哥们,原来是这样:这台DS4300上原来的几块盘是做过RAID的,但是缺少了一块。于是盘阵总认为后来插上的硬盘就是原来缺的那块硬盘,但实际上不是,而且我们还插了不止一块盘,所以就出错了。

    哥们将所有的盘都拔出去,再将盘阵重起,清除里面的信息,再关闭,把盘都插回去,就一切OK了。

    哦,这样啊!心算是放回肚子里了。再接着就是普通的划区后的工作,忙到了天亮。

    这边问题暂时解决了,但原来的阵列还一动不动躺在那里,里面的数据仍然没法儿拿出来,所有人的希望也就寄托在IBM的二线上,希望他们能够拿出最佳的解决方案来。


 

文章评论