CMU 15445 15. TO + OCC + MVCC
data:image/s3,"s3://crabby-images/c0d31/c0d31815cd6f108b4ccc569ab7ae4aee33f9fe11" alt=""
时间戳排序(T / O)是一种乐观的并发控制协议类,其中DBMS假定事务冲突很少。 DBMS不是要求事务在允许读取/写入数据库对象之前获取锁,而是使用时间戳来确定事务的可序列化顺序。
大致思路是给每个事务一个时间戳
data:image/s3,"s3://crabby-images/47908/47908df84a4aee45ffdf254a290a3f41c80cf881" alt=""
当事务要拿一个未来时间的object,它会abort或者重启。
我们看下读的规则。
data:image/s3,"s3://crabby-images/d2d0b/d2d0b61503c6b0df011a3b85fa208f122619389e" alt=""
写的规则
data:image/s3,"s3://crabby-images/c7406/c7406063f07e70530a5c5b31de10d01ad1ff7cbd" alt=""
2个example
成功的例子
data:image/s3,"s3://crabby-images/51353/51353446613c39eaf4c41ff0cabe3018f2422c64" alt=""
data:image/s3,"s3://crabby-images/6cba0/6cba0a9fcaabd099237474a1f2948df630186b0c" alt=""
回滚的例子
data:image/s3,"s3://crabby-images/e1963/e19634e9f118d366253330b3de405ac02f42f438" alt=""
thomas-write 规则
data:image/s3,"s3://crabby-images/761e7/761e7f52812eb8e630f7845455fea0371f8bd8b8" alt=""
data:image/s3,"s3://crabby-images/57214/5721407dba2c03610b3e9534af5f8b67ed73ab05" alt=""
如果您不使用托马斯写入规则,则基本T / O协议会生成conflict serializable 的计划。 因为没有事务等待它不会有死锁。 但如果短事务不断引发冲突,那么长期事务就有可能出现饥饿。
它还是不可恢复的计划。 如果事务仅在所有读取或提交更改的事务之后提交,则可以恢复调度。 否则,DBMS无法保证事务读取将在从崩溃中恢复后将恢复的数据。
data:image/s3,"s3://crabby-images/865bf/865bff55f1615616558e28b1b145f1a012ab7d72" alt=""
OCC
对于假设事务不会发生冲突的常见情况,OCC可能是更好的方法。
当冲突数量很少时,OCC运作良好。 这是当所有事务都是只读或当事务访问不相交的数据子集时。 如果数据库很大并且工作负载没有偏差,那么冲突的可能性很小,因此加锁是浪费的。
DBMS为每个事务创建一个私有工作区:
- 所有修改都应用于私有工作区。
- 将读取的任何对象复制到工作空间中。
- 没有其他事务可以读取其私有工作空间中另一个事务所做的更改。
当事务提交时,DBMS会比较事务的工作空间写入集,以查看它是否与其他事务冲突。 如果没有冲突,则将写入集覆盖到“全局”数据库中
data:image/s3,"s3://crabby-images/c2341/c234118f8211cf39dde36afaa18260b1f73f3ef7" alt=""
data:image/s3,"s3://crabby-images/ddf30/ddf303bfe57414f964c2ab822322f70f129fa329" alt=""
验证阶段
这是DBMS检查事务是否与其他事务冲突的地方。 DBMS需要保证只允许可序列化的计划。 DBMS在进入验证阶段时分配事务时间戳。
Ti检查RW和WW冲突的其他事务,并确保所有冲突都是单向的(从旧事务到年轻事务)。 DBMS使用所有其他正在运行的事务检查提交事务的时间戳顺序
MVCC
核心特性是
Writers don’t block the readers. Readers don’t block the writers.
只读事务可以在不获取锁的情况下读取一致的快照。 时间戳用于确定可见性。
轻松支持DBMS可以在时间点快照上执行的时间旅行查询。
有四个重要的MVCC设计决策:
1.并发控制协议(T / O,OCC,2PL等)。
2.版本存储
3.垃圾收集
4.索引管理
版本存储
就是关于DBMS如何存储逻辑对象的不同物理版本。
DBMS使用元组的指针字段为每个逻辑元组创建一个版本链。 这允许DBMS在运行时查找特定事务可见的版本。 索引总是指向链的头部。 线程遍历链,直到找到可见的版本。 不同的存储方案确定每个版本的存储位置/内容。
data:image/s3,"s3://crabby-images/b4a08/b4a080e43e523b4029215d4760e601ebaf336c94" alt=""
APPEND ONLY
data:image/s3,"s3://crabby-images/6c6e7/6c6e712f173b734b659143bbf046212807d706b8" alt=""
TIME TRAVEL
data:image/s3,"s3://crabby-images/a06e9/a06e9d195dff9a438aee3f09521501d78701e3b4" alt=""
data:image/s3,"s3://crabby-images/ae238/ae238e91536fedcfedff3667931a6a49facf04c2" alt=""
data:image/s3,"s3://crabby-images/8e15e/8e15ebb56067cfbfbd40a71bc9ea6a47d39e8ea3" alt=""
data:image/s3,"s3://crabby-images/e6c5f/e6c5f438287d276dfe8aef03fba7f9c411baf7a1" alt=""
DELTA STORAGE
data:image/s3,"s3://crabby-images/43a88/43a88a1b52d085e70aa92416fde2da213be872cd" alt=""
data:image/s3,"s3://crabby-images/1e4d7/1e4d7b76516f49986140feebd6583ca71144db87" alt=""
data:image/s3,"s3://crabby-images/703b7/703b7bd1b1692838cdee2c9637895fd458eb9e11" alt=""
data:image/s3,"s3://crabby-images/907ac/907ac88cab665ef1f89b45f42a748b25ec467b03" alt=""
垃圾回收
DBMS需要随着时间的推移从数据库中删除可回收的物理版本。
→DBMS中没有活动的txn可以“看到”该版本(SI)。
→版本是由中止的txn创建的。
data:image/s3,"s3://crabby-images/0dec8/0dec8efc96b53a8bc12c3f319efc6f6a149c2ff5" alt=""
方法#1:元组级垃圾收集 - 通过直接检查元组查找旧版本
•Background Vacuuming:单独的线程定期扫描表并查找可回收的版本,适用于任何版本的存储方案。
data:image/s3,"s3://crabby-images/9bfb1/9bfb15143a8fac9dc65692307df5c773982a1cc1" alt=""
data:image/s3,"s3://crabby-images/7b19a/7b19aa75f6bcb09ecd4e32b2eeac65fee9e05782" alt=""
•协作清理:工作线程在遍历版本链时识别可回收的版本。 仅适用于OLD2NEW。
data:image/s3,"s3://crabby-images/9b191/9b191ea6f8bcdceb825f61d1297c68c785299fa6" alt=""
方法#2:事务级别 - 每个事务都跟踪自己的读/写集。 当事务完成时,垃圾收集器可以使用它来识别要回收的元组。 DBMS确定完成的事务创建的所有版本何时不再可见。
data:image/s3,"s3://crabby-images/8181d/8181d0ac489694e2c4cd533275a27603504903dc" alt=""