Java中的HashMap

2017-06-22 本文已影响34人尉昌达

自己在简书上看了不少的别人总结，那么在借鉴前人（miaoLoveCode）基础上自己再总结一番。

HashMap1.8实现分析

数据结构

1.8的HashMap数据结构是由数组+（链表或红黑树）实现。

构造方法

JDK8的构造方法

几个基本量：

capacity：容量，bucket数组长度，默认长度为16；
loadFactor：装载因子，默认值为0.75，它决定了bucket填充程度；
threshold：决定了HashMap能够放进去的数据量。
对于threshold的初始化会调用tableSizeFor方法计算出一个比initialCapacity大的第一个2的n次幂的值存入threshold。

tableSizeFor

bucket的初始化一般都是在第一次调用put方法时完成的。

Hash

JDK 8 中在进行get和put操作时，会先根据key的hashCode进行再散列，再进行bucket对应节点位置计算，请看以下示例：

hash及下标计算

可以看出：h >>> 16，高16位补0，由于任意数跟0异或不变，所以hash的作用就是高16位不变，低16位和高16位做异或运算，来达到减少碰撞的目的。
hash方法的实现：

hash方法

为了提高碰撞下的性能，当链表节点等于8时，JDK8用红黑树代替链表，将原有链表部分查询的时间复杂度o(n)提升为o(logn)，继续看JDK 8中的put方法的具体实现。

put方法

put实现

putVal

putVal实现

具体流程如下：
1.如果当前bucket为空时，调用resize（）方法初始化；
2.根据key的hash值计算出所在的bucket节点的位置；
3.如果没有冲突，也就是

p = tab[i = (n - 1) & hash]=null

调用newNode方法封装key-value键值对，并将其挂到 bucket对应位置下，否则，跳转到步骤4；
4.如果发生冲突

遍历链表，如果该key已经存在，则更新原有的oldValue为新的value，并返回oldValue。直到链表末尾没有相同的key的hash值和key（equals，==），则在末尾插入新节点；
如果key所在的节点为treeNode，调用rbtree（红黑树）的putTreeVal方法将改节点挂到rbtree上；
如果插入节点后，当前bucket节点下链表长度超过8，需要将原有的数据结构链表变为rbtree；

5.数据put完成之后，如果当前数组长度 > threshold，调用resize方法扩容。

resize（）

resize前半部分

resize的前半部分主要完成了新的capacity和threshold的计算。从代码实现可以看出，每一次扩容，newCapacity和newThreshold均是扩容前值的两倍，如此设计师为什么？先看个例子来说明这样子设计的原因：

resize后index计算

从小例子可以看出，resize后，key所在bucket的节点位置保持不变。首先，table.length也就是capacity肯定是2的n次方，根据所在bucket节点下标计算公式：index = hash & (table.length - 1)，其实在进行&运算的时候，只是多了一个最高位1，那么新位置要么保持原位置不变，要么在原位置 + oldCapacity，这个设计的巧妙就在于节省了一部分重新计算hash的时间，而且hash值高位出现0和1的概率均等，在resize的过程又将节点平均分配到两个bucket节点。

resize的后半部分对数据做了transfer，具体实现如下：

resize后半部分

总结

HashMap在JDk1.8比JDK1.7的优化主要在：
1.引入rbtree，在bucket节点下链表长度 = 8时将链表变成rbtree；
2.优化hash和resize，减少resize带来的hash性能消耗。