mysql索引

2018-10-28 本文已影响0人 CoderZzbJohn

1.mysql引擎：innodb，myisam

两者的区别：

innodb：聚集索引。数据文件本身就是索引文件。表本身就是一棵B+树。B+树的key为表的主键。若表没有主键，会默认生成一个6个字节的长整形作为主键。当未某个字段建立索引时，会生成一颗B+树，该树存储原数据的主键id。innodb按照主键来查询时，速度非常快，因为表本身就是一颗B+树。按照辅助索引来查询时，需要先根据索引值查找到节点获取原数据的主键，再根据主索引来查找。innodb所有的辅助索引，都是以主键作为data域的值。

1.推荐使用自增的id作为主键。因为innodb主表为b+树，如果id非自增时，每次新增数据时，可能造成为了维护b+树的特性，必须频繁的分裂调整。

2.主键不宜过长。因为主键做为辅助索引的data值，主键过长容易造成辅助索引过大。

myisam：非聚集索引。当为某个字段建立了索引时，生成一颗B+树，data节点存储元数据的内存地址。

索引：索引是一种优化查询的数据结构。innodb默认将以主键作为唯一索引。

最左前缀原理：建立了索引之后，不一定每次查询都能用的上索引。1.例如，给A，B，C三个字段建立联合索引。即一个磁盘块中一个节点的key为A+B+C。当以AC为条件查询时，只会以A作为条件在B+树上查，然后以C为条件进行过滤。有一个方法可以绕过这个，当B的值的可能性较少时，可以 select * from where A='##' and B in(####) and C='###'。 2.原则上来说，索引时以来where后面查询条件的顺序的，索引列一定要放在条件的前面。但mysql在查询时会做一定的优化，会调换where条件的顺序。

3。匹配某个字段的前面部分例如 like '%abcd'走索引。但是like'%abcd'无法通过索引查询。

4.范围查询。where id< 100 and name='abc' 前面的条件可以用到索引。后面用不到。范围查询中要是有两个条件带范围，只能有一个走索引。

5.当查询条件中带有函数或者表达式时，无法走索引。例如 where id-1=100

索引的选择性：set/List。所有可能的数据/数据总行数。该数值越大时，表明越有建立索引的必要。另外，当一张表中，数据行数超过2000时，有必要建立索引。

前缀索引：以一个字段或者某几个字段中的部分值作为索引，不一定要求完整的字段。比如firstName和lastName，可使用firstName+left(leftName,5)作为联合索引。

2.b+树，在各个节点之间存在指针。方便区间范围内的查询。

3.内存读写以及磁盘读写。

内存读写时，有一个地址主线和数据主线。整块内存相当与一个位置矩阵。查询数据时，地址主线传入一个x，y地址。内存根据地址查找具体位置的数据返回给数据总线。

磁盘读写时。磁盘上，有多个盘面。各个盘片有一个中心的轴，盘面绕着轴一起同步转动。每个盘面上有多个磁道，磁道类似于跑道。每个磁道，根据中心轴的角度，划分为多个扇区。在盘面的侧边，有多个磁头，每个盘面对应着自己盘的磁头。各个磁头可以同步的延着磁盘半径运动读取数据。因此读数据时，需要机械运动时间，即磁盘io时间。寻道时间+旋转时间。

当一块数据被用到时，它附近的数据通常也很快会被用到。局部性原理。

https://blog.csdn.net/z_ryan/article/details/79685072

https://blog.csdn.net/guoziqing506/article/details/64122287

https://blog.csdn.net/v_july_v/article/details/6530142

4.b树与b+树区别。索引之所以使用b+树，是因为b+树的结构可以减少磁盘io的次数。一颗深度为n的树，最多产生n次磁盘io。矮胖型的树能减少io次数。b树上，所有节点上都会存储数据，非根节点上存储子节点的指针。b+树，只有叶子节点才会存储数据，这样，当磁块大小固定时，每个磁块上可以存储个数更多的节点。因此更适合于数据库索引。b树在新建节点的时候，每一个节点大小刚好设置为一个磁盘块的大小，这样每个节点只需要一次io，寻找节点的时间复杂度为O（h）。

5.b数的定义。度。一颗度为5的数。每个节点最多有4个关键字，5个子节点。

1.一棵度为M的数。除了根节点和叶子节点之外，每个节点至少有m/2下取整个key，m/2+1个子节点。最多有M-1个关键字，M个子节点。

2.所有叶子节点在同一层中。

mysql索引

猜你喜欢

热点阅读