2018-04-03|insert流程-检查点(CHECKPOI
检查点(CHECKPOINT)简介
CHECKPOINT又名检查点,在oracle中checkpoint的发生意味着之前的脏数据全部写回磁盘,数据库实现了一致性与数据完整性。简单讲postgres中的CHECKPOINT的作用:写脏数据;完成数据库的完整性检查。
PG检查点的类型
Shutdown检查点:在PG实例shutdown时做的检查点
Recovery End检查点:在recovery 结束阶段做的检查点,类似于shutdown检查点,只不过在WAL恢复结束时发起。
Immediate检查点:不仅仅创建检查点,而且会马上做。这类请求一般在比较紧急的情况下,需要马上获取数据库一致状态的情况下。
Force检查点:即使没有xlog变更,也会做。请求这类检查点,往往只是想得到最近的checkpoint location而已。
上面几个检查点,会直接影响检查点的创建以及检查点的完成时机。
Wait检查点:检查点不会马上做,但会一直等待,直到检查点完成。往往比较重要的一些操作,但不是非常紧急的,可以请求该类检查点。尤其是一些DDL操作,对数据一致性要求高于响应时间。
另外,还有一类检查点,这类检查只是作为logging的标识:
xlog检查点:由xlog的消耗引起,产生新xlog文件。
time检查点:由时间elapse引起。
flush检查点:当发起flush 所有pages时发起,包括那些不logging的表。
PG会根据目的以及不同时机,请求相应的检查点。
PG检查点的机理
checkpoint进程由postmaster负责创建。作为postmaster的子进程而存在,为几大重要的后台进程之一。
从下图中,可知postmaster进程号为2694。checkpoint的进程号为2696,其父进程号为2694,即为postmaster。

checkpoint进程挂掉后,postmaster会杀掉所有backend进程,然后逐一恢复后台进程,有点类似于系统被初始化后。可见此进程对数据一致保护的重要性。
因为数据库系统要达到一个目的:即任何已经做过checkpoint的更改,不需要从WAL日志中恢复。这大大加快了数据库系统crash后的恢复速度。
在源码中,checkpoint相关的信息由一个结构体记录,放在共享内存段中:

它保存了当前checkpoint 的pid,检查点起始位置,检查点完成位置以及检查点类型等信息。另外也维护了一个检查点队列。一般的检查点请求只是创建一个检查点位置,并放到队列中,并不会马上做,检查点调度由另外逻辑来控制。
checkpoint的位点是跟xlog的位置强相关的,其实就是WAL日志的位点。
每当检查完成之时,就必须要求此检查点前的数据更改或者脏页被写入物理磁盘,并持久化。
检查点发送的时机
下列任意条件会导致Checkpoint发生:
shared_buffers中,产生了 checkpoint_segments*16MB 以上的数据。
距离上次Checkpoint发生,经过了 checkpoint_timeout *checkpoint_completion_target 秒。
用户执行Checkpoint 命令。