mysql索引
1.mysql引擎:innodb,myisam
两者的区别:
innodb:聚集索引。数据文件本身就是索引文件。表本身就是一棵B+树。B+树的key为表的主键。若表没有主键,会默认生成一个6个字节的长整形作为主键。当未某个字段建立索引时,会生成一颗B+树,该树存储原数据的主键id。innodb按照主键来查询时,速度非常快,因为表本身就是一颗B+树。按照辅助索引来查询时,需要先根据索引值查找到节点获取原数据的主键,再根据主索引来查找。innodb所有的辅助索引,都是以主键作为data域的值。
1.推荐使用自增的id作为主键。因为innodb主表为b+树,如果id非自增时,每次新增数据时,可能造成为了维护b+树的特性,必须频繁的分裂调整。
2.主键不宜过长。因为主键做为辅助索引的data值,主键过长容易造成辅助索引过大。
myisam:非聚集索引。当为某个字段建立了索引时,生成一颗B+树,data节点存储元数据的内存地址。
索引:索引是一种优化查询的数据结构。innodb默认将以主键作为唯一索引。
最左前缀原理:建立了索引之后,不一定每次查询都能用的上索引。1.例如,给A,B,C三个字段建立联合索引。即一个磁盘块中一个节点的key为A+B+C。当以AC为条件查询时,只会以A作为条件在B+树上查,然后以C为条件进行过滤。有一个方法可以绕过这个,当B的值的可能性较少时,可以 select * from where A='##' and B in(####) and C='###'。 2.原则上来说,索引时以来where后面查询条件的顺序的,索引列一定要放在条件的前面。但mysql在查询时会做一定的优化,会调换where条件的顺序。
3。匹配某个字段的前面部分例如 like '%abcd'走索引。但是like'%abcd'无法通过索引查询。
4.范围查询。where id< 100 and name='abc' 前面的条件可以用到索引。后面用不到。范围查询中要是有两个条件带范围,只能有一个走索引。
5.当查询条件中带有函数或者表达式时,无法走索引。例如 where id-1=100
索引的选择性:set/List。所有可能的数据/数据总行数。该数值越大时,表明越有建立索引的必要。另外,当一张表中,数据行数超过2000时,有必要建立索引。
前缀索引:以一个字段或者某几个字段中的部分值作为索引,不一定要求完整的字段。比如firstName和lastName,可使用firstName+left(leftName,5)作为联合索引。
2.b+树,在各个节点之间存在指针。方便区间范围内的查询。
3.内存读写以及磁盘读写。
内存读写时,有一个地址主线和数据主线。整块内存相当与一个位置矩阵。查询数据时,地址主线传入一个x,y地址。内存根据地址查找具体位置的数据返回给数据总线。
磁盘读写时。磁盘上,有多个盘面。各个盘片有一个中心的轴,盘面绕着轴一起同步转动。每个盘面上有多个磁道,磁道类似于跑道。每个磁道,根据中心轴的角度,划分为多个扇区。在盘面的侧边,有多个磁头,每个盘面对应着自己盘的磁头。各个磁头可以同步的延着磁盘半径运动读取数据。因此读数据时,需要机械运动时间,即磁盘io时间。寻道时间+旋转时间。
当一块数据被用到时,它附近的数据通常也很快会被用到。局部性原理。
https://blog.csdn.net/z_ryan/article/details/79685072
https://blog.csdn.net/guoziqing506/article/details/64122287
https://blog.csdn.net/v_july_v/article/details/6530142
4.b树与b+树区别。索引之所以使用b+树,是因为b+树的结构可以减少磁盘io的次数。一颗深度为n的树,最多产生n次磁盘io。矮胖型的树能减少io次数。b树上,所有节点上都会存储数据,非根节点上存储子节点的指针。b+树,只有叶子节点才会存储数据,这样,当磁块大小固定时,每个磁块上可以存储个数更多的节点。因此更适合于数据库索引。b树在新建节点的时候,每一个节点大小刚好设置为一个磁盘块的大小,这样每个节点只需要一次io,寻找节点的时间复杂度为O(h)。
5.b数的定义。度。一颗度为5的数。每个节点最多有4个关键字,5个子节点。
1.一棵度为M的数。除了根节点和叶子节点之外,每个节点至少有m/2下取整 个key,m/2+1个子节点。最多有M-1个关键字,M个子节点。
2.所有叶子节点在同一层中。