读数据保护:工作负载的可恢复性06备份的内容
1. 误解
1.1. RAID不需要备份
-
1.1.1. 使用冗余磁盘系统来保存数据,并不意味着不需要备份这些数据
-
1.1.2. RAID所能提供的冗余都是在硬件这一层面设计的
-
1.1.3. 之所以不能代替备份,其中一项重要的原因就在于:RAID保护的是卷,而不是卷里面的文件系统
1.2. 启用了数据复制机制就不用再做备份了
-
1.2.1. 复制或者重制(replication)只是把所有东西都照搬一遍,无论是正确的操作,还是错误的乃至恶意的操作,其操作结果都会照搬到副本上
-
1.2.2. 复制不仅无法消除错误并阻止病毒,还会让错误或病毒变得更加严重
1.3. IaaS与PaaS不需要备份
-
1.3.1. 高可用性也无法防范误操作、网络攻击,或者数据中心遭到物理破坏的情况
-
1.3.2. 要把云端备份跟你的云端主账号分开存放,而且不要放在跟主数据相同的区域里面
1.4. SaaS不需要备份
- 1.4.1. 提供那种利用版本管理系统与回收站等机制而打造的便捷恢复(convenience restore)功能,这样的功能无法防范严重故障或网络攻击
1.5. 备份系统应该把备份数据保存好多年,以便从中调取信息
- 1.5.1. 备份产品通常不用来做档案方面的工作
1.6. 磁带已经消亡
-
1.6.1. 不是因为觉得磁带不可靠,而是因为它跟我们目前做备份的节奏不搭调
-
1.6.2. 磁带机在写入0与1这样的数据时,要比磁盘更可靠,而且这种数据能够保留在磁带上的时间,也比磁盘更久
-
1.6.3. 如果磁带机每秒钟想要写入1GB数据,而你运行的备份程序每秒钟却只能给出几MB的数据,那么在这种情况下就根本无法用磁带做备份
-
1.6.4. 今天买磁带的人比以往任何时候都要多
-
1.6.4.1. 型的磁带柜卖得很好,而且这些磁带柜里保存着重要的数据
-
1.6.4.2. 大型的云平台厂商都买了许多这样的磁带柜
-
-
1.6.5. 磁带最好的用途是保存长期档案
-
1.6.5.1. 不要把增量备份直接保存到磁带上
-
1.6.5.2. 如果你有好几TB的档案保存在磁盘上,而旁边又有磁带机,那么把这些档案用磁带机写入磁带就会相当顺畅
-
1.6.5.3. 磁带机能够将数据可靠地写入磁带,而且这样的磁带能够保留相当长的时间
-
-
1.6.6. 磁带是相当廉价的存储介质
-
1.6.6.1. 不仅磁带便宜,读写磁带的磁带机本身也很便宜,磁带柜的耗电量与温控费用更是比磁盘系统小得多
-
1.6.6.2. 磁盘驱动器的耗电量与温控费用,会逐渐超过购买磁带机的费用以及这些磁带机的电费及温控费
-
-
1.6.7. 尽管现在已经几乎没有人再用磁带做备份与恢复了,但它依然能够继续用来长期保存数据
1.7. 把备份当成档案来用,成本真的相当高
2. 条目级备份
2.1. item-level backup
2.2. 通常称为文件级备份,但实际上备份的不一定全都是文件(也有可能是对象)
2.3. 条目级备份会把许多零散的信息分别作为条目备份下来,所谓条目,其最常见的一种形式就是文件
2.4. 另外一种形式,也就是对象存储系统里面的对象
2.5. 对于完全备份来说,它会把文件系统里位于相关路径下的所有文件全都备份下来
2.6. 对于增量备份来说,则只会涵盖该路径下自上次制作备份以来发生变化的那些文件
2.7. 条目级备份的优势在于,这种备份方式特别好懂
- 2.7.1. 只需要把备份软件安装到位,它就能够检视你的文件与对象存储系统,找到所有需要备份的条目,并在适当的时间将其备份下来
3. 镜像级备份
3.1. image-level backup
- 3.1.1. 也叫作驱动器级别的备份、卷(volume)级别的备份或虚拟机级别的备份
3.2. 镜像级备份则是我们目前备份虚拟环境时最常用的方式
3.3. 镜像级备份是在数据块(block)的层面备份某个物理设备或虚拟设备,这样制作出来的是整个设备的一份镜像
3.4. 在制作镜像级备份时,你备份的是整个文件系统,而不只是其中的某些具体文件
3.5. 虚拟快照技术,例如Windows系统的VSS(Volume Shadow Copy Service,卷影复制服务)与VMware虚拟机管理器的快照功能
3.6. 在镜像级别做备份与恢复,速度要比文件级别快得多
- 3.6.1. 备份恢复起来,速度也比文件级备份快得多
3.7. 镜像级备份会把整个驱动器或卷都给备份下来,因此对于其中的每个文件来说,这样制作出来的是完全备份(而不是增量备份)
3.8. CBT(Changed-Block Tracking,数据块修改追踪)技术,它会记录上一次备份是在什么时候创建的,并把从那个时间点算起发生变化的数据块记录下来
3.9. 缺点,就是不便于从里面直接恢复单个的条目(例如某个具体的文件)
4. 从镜像级备份里做文件级恢复
4.1. 提前给镜像内容制作索引,它们可以通过索引来了解某份文件在镜像中是由哪几个数据块表示的
5. 把文件级备份与镜像级备份结合起来
5.1. 大多数用户在备份虚拟机时做的都是镜像级备份,这样还能让他们在这种镜像的基础上做增量备份,并从中恢复单个的条目
5.2. 执行块级别的增量备份,因为这种增量备份的效率,要比条目级别的增量备份高得多
5.3. 只需要用这一个镜像,就能把整个虚拟机轻松地恢复出来
- 5.3.1. 裸机恢复(bare-metal recovery)执行起来容易多了
6. 选择有待备份的内容
6.1. 你的备份软件必须先知道工作环境里有这样一个系统需要备份,然后我们才能讨论怎样选择有待备份的内容
- 6.1.1. 最好先把有待保护的服务器与服务,注册到你的备份与恢复软件里面
6.2. 备份工作要把安全地保护数据放在第一位,成本是次要的
6.3. 包含法
-
6.3.1. 包含法(selective inclusion,也称选择性包含)
-
6.3.2. 如果采用包含法,那么管理员必须在备份系统里一个一个地指定有待备份的文件系统、数据库或对象
-
6.3.3. 包含法有一个问题,就是不能够很好地应对配置发生变化的情况
- 6.3.3.1. 包含法之所以远不如排除法稳妥,原因正在于此
-
6.3.4. 最坏的情况则是某些需要备份的重要数据未能纳入备份范围
-
6.3.5. 包含法所保存的数据通常比较少,因此看上去似乎比较省钱,但风险却比排除法高得多
-
6.3.6. 很多人都是因为漏掉了应该备份的数据而遭到解雇的
6.4. 排除法
-
6.4.1. 排除法(selective exclusion,也称选择性排除)
-
6.4.2. 排除法也可以理解成自动包含或默认包含(automatic inclusion),除非管理员明确将某个东西排除掉,否则服务器里的所有内容都会自动纳入备份范围
-
6.4.3. 最坏的情况也只不过是把某些无意义的数据给涵盖了进来(因为你忘了排除)
-
6.4.4. 把不需要备份的数据排除掉其实很容易
-
6.4.5. 在划定备份范围的时候,默认应该采用排除法(也就是自动包含法)。
-
6.4.6. 没有人会因为备份的数据太多而遭到解雇
6.5. 去重技术
-
6.5.1. 去重技术(deduplication,重复数据删除技术)对我们划定备份范围所带来的影响
-
6.5.2. 去重技术能够确保与Windows或Linux操作系统有关的那些内容在备份系统里只会存储一份
6.6. 根据标签或目录来选择
-
6.6.1. 把贴了某个标签的数据或位于某个目录中的数据自动纳入备份范围
-
6.6.2. 创建一套默认的备份策略,让备份系统能够为那些没有贴任何标签或没有放在特定目录中的虚拟机自动运用该策略