MySQL高级第三篇(索引优化分析)

2017-05-21  本文已影响0人  AD甜蜜蜜
  1. 索引是什么
    可以理解为排好序的方便快速查找的一种数据结构,索引有很多种,这里介绍BTree类型的索引。
    索引虽然可以提高查询速度,但是索引也是一张表,是要站内存空间的,并且索引会降低更新表的速度,因为要维护索引,所以在更新表的时候,要对索引进行更新,导致更新表的速度会降低。
  2. 索引创建情况分析
  1. BTree索引


    BTree

    注意: 非叶子节点不存储真实数据,只存储索引值,叶子节点存储真实数据,真实数据都在叶子结点上

  2. 使用explain查看sql执行计划进行优化
    使用方法,explain+sql语句,如:explain select * from student where id>10


    执行计划字段

    名次解释:(table就是查询中用到的哪张表,不做解释)

    1. id:select 查询的序列号,一组数字,表示查询中执行select字句操作表的顺序,其中顺序有三种
    • id相同,执行顺序由上至下,如下图:执行顺序为:t1表,t3表,t2表


      id相同执行图
    • id不同,如果是子查询,id的序号会递增,id值越大优先级越高越先被执行,如下图:执行顺序为:t3表,t1表,t2表


      id不同
    • id相同不同同时存在,id相同的为一组,由上往下执行,id大的优先执行的规则,如下图:执行顺序为:t3表,<deriverd2>表,t2表


      id相同不同
    1. select_type:查询类型,主要用于区别普通查询,联合查询,子查询等复杂查询有如下几个值:
    • SIMPLE:简单的select查询,查询中不包含子查询或union
    • PRIMART: 查询中若包含任何复杂的子查询,最外层被标记为PRIMARY
    • SUBQUERY:在select或where查询重包含子查询
    • DERIVED:在from列表中包含的子查询被标记为derived(衍生), MySQL会递归执行这些子查询,把结果放在临时表中
    • UNION:若第二个select出现在union之后,则被标记为union,若union包含在from字句的子查询中,则外层select被标记为deriverd
    • UNION RESULT:从union中获取结果的select
    1. type:访问类型排序,显示查询使用了何种类型,从最好到最差依次是:system>const>eq_ref>ref>range>index>all(重要的指标),一般优化到range级别,最好到ref
    • system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,可以忽略不计
    • const:表示通过索引一次就找到了,const用于比较primary key或者unique索引,因为只匹配一行数据,所以查询速度很快,如where id = 5;
    • eq_ref:唯一性索引扫描,对于每个索引键,表中只有一行与之匹配,常见于主键或唯一索引扫描。
    • ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,但是可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
    • range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引,一般就是在where语句中出现了between,<,>,in等查询,这种范围扫描,索引扫描比全表扫描要好,因为它只需要开始索引的某一点,而结束另一点,不用扫描全部索引
    • index:index与all的区别为in的类型只遍历索引树。这通常比all快,因为索引文件通常比数据文件小,也就是说虽然index和all都是读全表,但是index是从索引中读取,而all是从硬盘中读取。
    • all:将遍历全表以找到匹配的行。
    1. possible_keys: 显示可能应用到这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,被列出的索引不一定真的用到
    2. 实际使用的索引。如果为null,则没有使用索引,索引中若使用了覆盖索引,则该索引仅出现在key列表中
    3. key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的
    4. ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
    5. row:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数(受影响行数)
    6. extra:包含不适合在其他列中显示但十分重要的额外信息
    • using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引排序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
    • using temporary 使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询 group by
    • using index:表示相应的select操作中使用了覆盖索引,避免访问了表的数据行,效率不错。如果同时出现using where,表示索引被用来执行索引键值的查找。如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
    • using where:表明使用了where过滤
    • 详情1
    • 详情2
  3. 索引优化分析
    1. 链表查询,例如,select id,name,sex,class.name from student left join class on student.classId = class.classId 这是索引应该建在class表中的classId字段,因为left join中以左表为准,左表的数据要全部包含进来,而右表中的数据是过滤的,所以索引建右表比较好,建在左表没有太大的影响。同理右连接查询索引建在左表上。(即:永远用小的结果集驱动大的结果集。)
    2. 全值匹配,即查询的条件全部建了索引,如下图:
      • 全值匹配.png
    3. 最佳左前缀法则(如果索引了多列,即复合索引,要遵守最左侧前缀法则。指的是,查询从索引的最左前列开始并且不跳过索引的列)
      • 复合索引中,带头的索引一定要用,中间的也不能断,不然会导致索引失效,例如,创建了一个name,age,pos的符合索引,查询时,查询条件不按照name,age,pos的顺序来,可能会导致索引的失效,没有了带头的索引name,那么name,age,pos都失效,如果有name没有age,那么pos失效,如果中间的索引或者带头的索引失效,会导致后面的索引都失效。(导致索引失效的情况在4,7,8,9,10,11)
    4. 不在索引列上做任何操作(计算,函数,类型转换),会导致索引失效而转向全表扫描
      • 操作索引.png
    5. 存储引擎不能使用索引范围条件右边的列
      • 范围查询失效
    6. 尽量使用覆盖索引(脂肪纹索引的查询(索引列与查询列一致)), 减少select *
      • 覆盖索引.png
    7. mysql 在使用不等于(!= 或者<>)的时候无法使用索引,会导致全表扫描
      • 范围导致索引失效.png
    8. like 以通配符开头('%a...')mysql索引失效,会变成全表扫描(%放开头,索引可能失效,%不开头索引不失效)
      • %号.png
      • 如果查询的列都建了索引,那么使用%开头,索引不会失效
      • 不失效情况
    9. is null ,is not null 也无法使用索引(所以建表的时候,关键字段尽量避免空值,最好有一个默认值)
    10. 字符串不加单引号索引失效
      • 引号导致索引失效.png
    11. 少用or,用它来连接是索引失效
上一篇下一篇

猜你喜欢

热点阅读