哈希索引

2020-05-25  本文已影响0人  数据100

概述

数据库中经常用到的索引包括hash索引和B树索引。


定义

哈希索引(hash index)是基于hash表实现的。

当某列需要创建hash索引时,存储引擎会将该列所有的值分别通过hash函数生成一个hash编码,不同的值计算出来的hash编码也不一样。存储引擎将hash编码按顺序存储在索引中,同时在hash表中存储指向对应数据行的指针。若出现hash冲突,则使用链表存储不同的对应指针。


原理

hash散列

优势


劣势


结合优化

MySQL中InnoDB存储引擎有一个功能叫自适应哈希索引,它将B树索引和hash索引进行了结合。

思路

在内存中基于B树之上创建伪hash索引,即将原本存在B树节点上的数据值变成存储该数据值的hash码。

当进行数据查找的时候根据该数据值的hash码进行查找(在B树上),找到hash码后再根据对应hash表找到对应数据行。

应用优势

当数据值很长(比如URL),若完全以B树构建索引,则空间很大。若以上述方式构建索引(先将值hash,然后在构建成B树索引)则会节省空间。并且使用hash码在B树上查找也能增加效率(整数比较)。

缺点

为避免hash冲突造成的影响,where查询条件中一般需要包含该常量值。否则可能出现冗余/不正确的返回结果。

select id 
from url
where url_crc = CRC32("www.baidu.com")
      and url = "www.baidu.com"
// url_crc 为构建了自适应索引的列
上一篇 下一篇

猜你喜欢

热点阅读