mysql 之索引篇

2019-04-21  本文已影响0人  小河土

 索引 为为了加速数据检索 减少磁盘IO操作 而创建的一种分散存储的数据结构。索引是由各大引擎来实现的。

索引的好处:减少存储引擎需要扫描的数据量、把随机IO变成顺序IO、帮主我们在进行分组排序的等操作的时候避免使用临时表。

普通二叉树

普通二叉树由于本身存储的特性, 会造成高瘦的这种情况, 而我们要的是矮胖,这样在查询数据的时候,才能更快找到数据。高瘦的话  层次太深了不利于查找,于是这里就出现了AVL树

平衡二叉查找树

又称AVL树

规则 左子节点 和右子节点高度差不能超过1 超过就会进行旋转 来保持两个节点之间的高度差,这个方案很好的解决了二叉查找树退化成链表的问题,把插入,查找,删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间,不过相对二叉查找树来说,时间上稳定了很多。

但是这种数据结构在mysql里面还是不能满足, 因为每个节点 存放一个关键字 加上数据区 再加上子节点引用

造成的缺点

最坏情况下磁盘的IO次数由树的高度决定,所以减少磁盘IO次数就必须压缩树的高度,让瘦高的树尽量变成矮胖的树,这样B-树就诞生了

B-树

多路平衡查找树:它在平衡二叉树的基础上做了增强。

1.数中每个节点之多有m个孩子(m>2)

2.根结点至少拥有两颗子树(存在子树的情况下)

3.除了根结点以外,其余每个分支结点至少拥有 m/2 棵子树

4.所有的叶节点都在同一层上

如图:

        B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点。

B-树的特性:

1.任何一个关键字出现且只出现在一个结点中;

2.搜索有可能在非叶子结点结束;

3.其搜索性能等价于在关键字全集内做一次二分查找;


但是这种还是不能满足mysql的要求于是就出现了b+树B+树 可以看成是B-树的 加强版

如图:

B+树和B-树的区别:

1.B+树关键字搜索采用闭合区间

2.B+ 非叶节点不保存数据相关信息,只保存关键字和子节点的引用

3.B+ 关键字对应的数据保存在叶子节点中

4.叶子节点是顺序排列的,相邻的节点具有顺序应用关系

相比B-树的优点:

1.扫表能力强

2.磁盘读写能力强

3.排序能力更强

4.查询效率更稳定

B+树 在Myisam中B+树体现形式:

如图:

           主键索引和辅助索引都会有一个指针指向数据区, 为什么是这样存储,这是跟myisam的数据存储有关的,myisam中 索引 和数据都有一个单独文件存储。

B+树 在在Inodb中B+树体现形式:

Myisam 和Innodb 查找数据方式的区别

 Innodb 中储存数据中索引和数据都是放在一个文件中。由主键索引指针指向数据区, 其他辅助索引也都是指向主键索引的指针,也就是辅助索引每次查询都是去找主键索引然后再找到数据。如果表没有主键,Innodb 为建一个隐式的主键。

Mysiam :数据和索引文件时单独存放的,主键和辅助索引 都是指针指向数据区的

索引相关知识补充:

1.每张表的索引 不超过5个

2.索引字段宽度尽量短

3.使用离散度高的列作为索引

4.经常用的列优先(组合索引。最左匹配)

        以上只是针对自己理解整理索引相关的知识,当然也借见其他帖子一些关于Tree的语句。这里对于各种树并没有详细对各种树做说明,有说的不对,不详细的请指出来,万分感谢。

                                                                                                                                   -----小河土。

上一篇下一篇

猜你喜欢

热点阅读