快速业务通道

成功恢复新网LINUX REISERFS 6块盘 RAID5邮件服务器

作者 佚名技术 来源 Linux系统 浏览 发布时间 2012-05-05
[申明]
转载请保留原作网站:[url]http://www.sjhf.net[/url] 关键字[LINUX数据恢复]

[摘要]
新网([url]http://www.xinnet.com[/url]),企业邮件服务器,存储于146G×6 RAID5中,有上百万企业用户的邮件,数据区,只分一个区,文件系统为REISERFS,正常工作中,RAID突然OFFLINE,管理员到机房检查时,发现有两块盘报警,将其中一块强制上线后发现卷无法MOUNT,于是强行FSCK 并REBULD TREE,历时4天,完成后仍无法MOUNT.无奈之下,向数据恢复公司求救,大多数公司无法提供可行的解决方案.新网在多方比较及评估后,选择让我们完成.
[分析]
这种RAID的问题事实上是很常见的,通常是亮灯的两块盘并不是同时掉线,而恰巧的是,强制上线了早离线的硬盘,导致数据区新鲜的和陈旧的混在一起,文件系统结构不一致.本身强制上线后,会在读写过程中生成新的检验条带,会影响一部分数据,但如果读写不多或根本无法MOUNT的话,这种灾难的严重性将会小得多,此例中最为严重的问题在于REBUILD TREE,相当于试图将一个混杂的文件系统连续化.这样的结果将会导致文件系统的所有结构体全面出错,通常这是无法挽救的.加上用户的文件目录结构非常复杂,文件总数粗略估计上亿,更是机会渺茫. [解决方案]
1、应试图将文件系统结构区单独提出来进行分析,这样工作量会小很多,也给反复查找分析提供了可能.但REISERFS的文件系统区相对较散且无规律,需通过自主程序进行提取及分析,此例中,光1级节点提出的大小达6G之大,文件结构可谓复杂.(用户也是因EXT3面对这样的结构崩溃才选用REISERFS的,可见其结构复杂程度)
2、对文件系统区进行一致性检验,相当于手工FSCK,修正错误地方,此例中,好多文件系统节点区都因检验关系,使关键属性字节发生了改变.通过程序将所有节点状态统一初始化,完成节点一致性处理
3、完成上述两步后有两种做法,一是在LINUX系统下再次FSCK,此例效果不好,(因LINUX FSCK的功能有限,在父节点稍有错误,其子节点便会全部打入LOST FOUND里,无法还原原本的目录结构),二是通过只读方式,用自主程序在WINDOWS下提取数据,需忽略许多错误,修改程序后,使用此法,所有数据已可提取. [后记]
最近这种两块硬盘离线,不知道哪块先离、哪块后离的例子很多.希望RAID用户可以在两块硬盘离线后谨慎对待,如果可以查到日志,通过日志确定为好.如果强制上线出错,应马上停止操作,切不可做FSCK等操作.
另外,老生常谈的事,LINUX的FSCK风险很大(实际WINDOWS也会有),做之前请尽量看清提示,如果出错信息异常,应选择其他途径.

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号