Java中的HashMap

2017-06-22  本文已影响34人  尉昌达

自己在简书上看了不少的别人总结,那么在借鉴前人(miaoLoveCode)基础上自己再总结一番。

HashMap1.8实现分析

数据结构

1.8的HashMap数据结构是由数组+(链表或红黑树)实现。

构造方法

JDK8的构造方法

几个基本量:

tableSizeFor

bucket的初始化一般都是在第一次调用put方法时完成的。

Hash

JDK 8 中在进行get和put操作时,会先根据key的hashCode进行再散列,再进行bucket对应节点位置计算,请看以下示例:

hash及下标计算

可以看出:h >>> 16,高16位补0,由于任意数跟0异或不变,所以hash的作用就是高16位不变,低16位和高16位做异或运算,来达到减少碰撞的目的。
hash方法的实现:

hash方法

为了提高碰撞下的性能,当链表节点等于8时,JDK8用红黑树代替链表,将原有链表部分查询的时间复杂度o(n)提升为o(logn),继续看JDK 8中的put方法的具体实现。

put实现 putVal实现

具体流程如下:
1.如果当前bucket为空时,调用resize()方法初始化;
2.根据key的hash值计算出所在的bucket节点的位置;
3.如果没有冲突,也就是

p = tab[i = (n - 1) & hash]=null

调用newNode方法封装key-value键值对,并将其挂到 bucket对应位置下,否则,跳转到步骤4;
4.如果发生冲突

5.数据put完成之后,如果当前数组长度 > threshold,调用resize方法扩容。

resize()

resize前半部分

resize的前半部分主要完成了新的capacity和threshold的计算。从代码实现可以看出,每一次扩容,newCapacity和newThreshold均是扩容前值的两倍,如此设计师为什么?先看个例子来说明这样子设计的原因:

resize后index计算

从小例子可以看出,resize后,key所在bucket的节点位置保持不变。首先,table.length也就是capacity肯定是2的n次方,根据所在bucket节点下标计算公式:index = hash & (table.length - 1),其实在进行&运算的时候,只是多了一个最高位1,那么新位置要么保持原位置不变,要么在原位置 + oldCapacity,这个设计的巧妙就在于节省了一部分重新计算hash的时间,而且hash值高位出现0和1的概率均等,在resize的过程又将节点平均分配到两个bucket节点。

resize的后半部分对数据做了transfer,具体实现如下:

resize后半部分

总结

HashMap在JDk1.8比JDK1.7的优化主要在:
1.引入rbtree,在bucket节点下链表长度 = 8时将链表变成rbtree;
2.优化hash和resize,减少resize带来的hash性能消耗。

上一篇 下一篇

猜你喜欢

热点阅读