磁盘打开crash后,掉电后文件系统损坏
2022-08-05 本文已影响0人
robot_test_boy
转载自华为服务支持的磁盘打开crash后,掉电后文件系统损坏
问题描述
物理机,开启磁盘cache,并且没有开barrier:整机下电后,出现文件系统损坏、数据损坏等现象。
原因分析
1. barrier关闭的情况下, 操作系统层面,按照数据、日志、元数据顺序下发,只能保证这部分数据按顺序下发到raid 卡cache或者磁盘cache , 并不保证落入磁盘。
而raid cache和磁盘cache,从经验来看,并没有保证先进先落盘,掉电的时候,任何IO均可能丢失。
这种情况下,可能出现各种损坏现象:
静态配置文件被删除
文件名称和属性显示”??”
文件数据损坏
………
2. barrier打开的情况下,下发完数据,日志和元数据后,分别会通知RAID控制卡和cache强制flush,从而保证顺序。
barrier=on是默认模式,但是需要关注存在不生效的情况,如下图所示:
磁盘初始化时,如果上报“Write cache:disabled”,则barrier不生效。比如RAID 3416,不带保电功能,RAID控制卡无cache,但是磁盘有cache。
解决方法
1. 替换为具备保电能力的SSD卡或者更换保电RAID。
2. 关闭磁盘cache,避免异常掉电cache中的IO丢失。