mysql_索引原理及优化

2016-09-07 本文已影响697人 hello_coke

<h3>思考：</h3>
我们知道mysql最好的数据存储量级是百万级别，是的往往在百万级别或者几十万级别就会出现慢查询(我对慢查询的定义是大于1秒)，几年前我所在的一个做pos机支付的联机交易的核心系统组，当时就做过一次索引优化最终的总的交易时间缩短了300毫秒，约占总耗时的1/3。就在近期我所在的部门的一个非常重要的商品结构组(目标是像淘宝商品看齐的)，频频爆出慢查询据说最慢的有5-6秒，总感觉太不应该，虽然最重要的接口都是缓存在redis，但是太多慢查询有可能会拖垮整个数据库，当缓存被穿透了也是要查db的给后续埋了隐患，所以就引发了我想写这篇文章。
<b>1、目前常用的索引有Hash索引和B+树</b>
1、Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B+Tree 索引。

但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端，主要有以下这些。
（1）Hash 索引仅仅能满足"=","IN"和"<=>"查询，不能使用范围查询。
（2）Hash 索引无法被用来避免数据的排序操作。
（3）Hash 索引不能利用部分索引键查询。
（4）Hash 索引在任何时候都不能避免表扫描。
（5）Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B+Tree索引高。
造成如上的主要原因是：hash是生成一个固定的结果没法做区间的查询也无法做排序，hash值是用所有的值来算的部分索引值是无效的，况且我们也可能遇到大量的hash值相同的情况这

2、B+树是目前主流的底层实现原理

B+树是一个平衡的多叉树，从根节点到每个叶子节点的高度差值不超过1，而且同层级的节点间有指针相互链接。这样不会造成数据倾斜，下面介绍一下InnoDB引擎的B+树结构(MyISAM实现的B+数略有不同)，B+树索引可以分为聚集索引(clustered index)和非聚集索引（即辅助索引，secondary index）。
<b>聚集索引</b>
索引组织表，即表中数据按主键B+树存放，叶子节点直接存放数据，每张表只能有一个聚集索引。当你定义primary key时其是聚集索引，如果你自己没定义则会生成一个默认的自增的长整型数
<b>辅助索引</b>
辅助索引（也称非聚集索引）是指叶节点不包含行的全部数据，叶节点除了包含键值之外，还包含一个书签连接，通过该书签再去找相应的行数据。下图显示了InnoDB存储引擎辅助索引和聚集索引的关系：

QQ截图20160907183233.png

以下所有的分析都是基于InnoDB存储引擎。
<b>2、分析索引好坏</b>
1、索引分析利器，explain：
<pre>

<h4>4、结束语</h4>
中国有句古话"天下武功唯快不破",我想的是mysql查询优化用好explain分析器，提前建好索引可以减少很多不必要的麻烦。当出现慢查询的时候看好索引或者修改join的写法，最终用explain来分析孰优孰劣，或许你会有意想不到的收获。

mysql_索引原理及优化

猜你喜欢

热点阅读