《持续交付》 - 数据管理
对于系统的测试和部署来说,数据及其管理对于整个系统来是非常重要的。相对于配置文件,数据所占的空间是非常大的,而且数据的生命周期比系统其它组成成分的生命周期要长。在部署新的代码时,我么一般会删除当前的版本,并将新版本完全替代旧的版本,这样就可以完全替代系统的初始状态。但对于数据的迁移我们一般不会这么做,因为数据是会不断增加的,所以每当我们对数据的结构或内容进行修改时,我们会将这些修改同步到版本库中,并编写统一的脚本来部署不同的数据版本,方便数据的迁移。
一 数据库的脚本化
和系统中其它变更一样,对于数据库的修改也应该通过自动化过程来管理。即数据库的初始化和其更改。将每一个的修改就提交到版本库中,这样在进行测试或部署的时候就可以做到一键部署数据库。
二 增量式修改
持续集成要求我们在每次对应用程序进行修改之后都要保证应用程序的正常运行,不管是对系统进行更新还是回滚。而持续交付则需要我们可以做到部署应用程序的任意一个已经通过验证的版本到生产环境。这也就需要我们对系统及相应的数据进行完备的版本控制,即对每一次修改都保存下来。
1、对数据库进行版本控制
- 在数据库中保存每次修改的版本号
- 每次对数据库进行修改,都将这个版本号+1
- 在部署时,使用某种工具查看当前的数据库版以及想要部署的版本。然后进行版本迁移
三 数据库回滚和无停机发布
1、保留数据的回滚
- 使用正常的回滚脚本进行回滚
- 将数据进行事务管理,对那些不想丢失的数据库进行事务缓存
2、将应用程序部署与数据库迁移解耦
金丝雀发布
四 测试数据的管理
1、为单元测试进行数据库模拟
- 避免使用真正的数据库,尽量使用测试替身代替与数据库打交道到服务
- 使用内建数据库
2、管理测试与数据之间的耦合
- 测试的独立性(test isolation):合理地组织测试,让每个测试的数据只对当前的测试有效
- 适应性测试(adapter tests):每次运行时对数据环境进行检查,并将这些数据作为数据基础进行测试
- 测试的顺序性(test sequencing):按照某种特定的顺序进行测试,每个测试依赖与前一个的输出
3、测试的独立性
4、建立和销毁
五 数据管理和部署流水线
在整个部署流水线上,对于数据的管理将会非常的复杂,因为每个阶段所需要的数据都大不相同。
1、调教阶段的测试数据
提交阶段是整个部署流水线的第一步,提交测试的快速运行对于整个流程来说是非常重要的,测试的速度越快,开发人员就可以更快的得到反馈进行处理。所以我们对于测试的数据尽可能少的真实数据来做测试,更多的应该使用测试替身。
2、验收测试中的数据
验收测试是系统测试,这也就是意味着测试数据必定会更加的复杂,但我们还是应该将每个测试对测试数据的依赖最小化梦,创建恰好够用的数据来验证系统的期望行为。
3、容量测试的数据
容量测试用来指出应用程序所需的数据规模问题。容量测试也可以看作是验收测试的重复利用,只是同时运行很多用例。这也就是说我们应该为测试提供足够的数据来进行测试。