拿壶酒来品好文-消零派099

磁盘打开crash后,掉电后文件系统损坏

2022-08-05  本文已影响0人  robot_test_boy

转载自华为服务支持的磁盘打开crash后,掉电后文件系统损坏

问题描述

物理机,开启磁盘cache,并且没有开barrier:整机下电后,出现文件系统损坏、数据损坏等现象。

原因分析

1. barrier关闭的情况下, 操作系统层面,按照数据、日志、元数据顺序下发,只能保证这部分数据按顺序下发到raid 卡cache或者磁盘cache , 并不保证落入磁盘。

而raid cache和磁盘cache,从经验来看,并没有保证先进先落盘,掉电的时候,任何IO均可能丢失。

这种情况下,可能出现各种损坏现象:

静态配置文件被删除

文件名称和属性显示”??”

文件数据损坏

………

2. barrier打开的情况下,下发完数据,日志和元数据后,分别会通知RAID控制卡和cache强制flush,从而保证顺序。

barrier=on是默认模式,但是需要关注存在不生效的情况,如下图所示:

磁盘初始化时,如果上报“Write cache:disabled”,则barrier不生效。比如RAID 3416,不带保电功能,RAID控制卡无cache,但是磁盘有cache。

解决方法

1. 替换为具备保电能力的SSD卡或者更换保电RAID。

2. 关闭磁盘cache,避免异常掉电cache中的IO丢失。

上一篇下一篇

猜你喜欢

热点阅读