HashMap笔记

2018-09-11 本文已影响13人 GavynZhang

HashMap

介绍

HashMap是一个以键值对形式保存数据的结构，实现了Map接口，可以接受null的键值，内部没有做同步处理，内部将key的hash值，key，hash，next(下一个结点)，包裹在一个对象中进行保存；

HashMap的工作原理

我们使用put(key,value)方法往HashMap中添加元素时，先计算得到key的Hash值，然后通过Key高16位与低16位相异或（高16位不变），然后与数组大小-1相与，得到了该元素在数组中的位置；

如果数组中该位置为空，则直接放入，如果不为空（出现了Hash冲突），则接到以数组该位置为链头的链表中；

在Java8中，链表的长度超过8，则使用红黑树来替换链表，以提高查找速度；

使用get从HashMap中读取元素时，先通过同样的方法计算Key在数组中的下标，再通过key的equals()方法来查找对应的元素；如果该位置是一个链表，则查找的速度为O(n)，如果该位置是红黑树，查找的时间复杂度为O(logN)；

如果HashMap的数组使用量超过了一个阈值（负载因子，默认0.75），HashMap将会resize，即重新开辟一个原来数组长度两倍的HashMap，并重新计算位置；

相关问题

为什么在resize的时候是扩展为原数组大小的两倍？

扩展为两倍是为了方便重新确定元素在数组中的位置，当扩展为两倍时，数组的大小在二进制中就相当于在高位多了一位，重新得到的位置要不就是在原位置，要不就是原位置加上原数组大小的位置；

因为index的计算是通过元素的hash与数组大小-1相与，数组大小-1在高位多了一位，则只需要在原来的hash的高位多取一位就是元素的index，这一位有可能是0，有可能是1，是0的时候元素的位置不变，是1的时候位置相当于加了原始数组大小的位置；

同时可以认为新增的那一位的值是随机的，也就是可以均匀地把元素分布在新的数组中；

举例：

数组的大小是16： 0000 0000 0000 0000 0000 0000 0001 0000

则数组大小减一是：0000 0000 0000 0000 0000 0000 0000 1111

扩容后数组大小是：0000 0000 0000 0000 0000 0000 0010 0000

数组大小减一是： 0000 0000 0000 0000 0000 0000 0001 1111

假设元素的hash是：1111 1111 1111 1111 0000 1111 0001 0101

原始的元素位置为：0101，即为5

扩容后的位置是：1 0101，为5 + 16 = 21

以下是扩容的代码（仅截取了为链表的部分）：

if (oldTab != null) {
    for (int j = 0; j < oldCap; ++j) {
        Node<K,V> e;
        if ((e = oldTab[j]) != null) {
            //从原始数组中取出头结点
            oldTab[j] = null;
            //如果只有一个元素，计算出新的位置并放置
            if (e.next == null)
                newTab[e.hash & (newCap - 1)] = e;
            //结点是树的情况    
            else if (e instanceof TreeNode)
                ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
            else { // preserve order
                //将该位置的元素分成两部分，一部分为增加的一位是1的(hi)，一部分为增加的一位是0的(lo)
                Node<K,V> loHead = null, loTail = null;
                Node<K,V> hiHead = null, hiTail = null;
                Node<K,V> next;
                do {
                    next = e.next;   // mark
                    //增加的一位是0
                    if ((e.hash & oldCap) == 0) {
                        //构造链表
                        if (loTail == null)
                            loHead = e;
                        else
                            loTail.next = e;
                        loTail = e;
                    }
                    //增加的一位是1
                    else {
                        if (hiTail == null)
                            hiHead = e;
                        else
                            hiTail.next = e;
                        hiTail = e;
                    }
                } while ((e = next) != null);
                //对增加的一位是0的元素进行处理
                if (loTail != null) {
                    loTail.next = null;
                    //放置的位置为原始位置
                    newTab[j] = loHead;
                }
                //对增加的一位是1的元素进行处理
                if (hiTail != null) {
                    hiTail.next = null;
                    //放置的位置为原始位置加上原始数组大小
                    newTab[j + oldCap] = hiHead;
                }
            }
        }
    }
}

在计算index时为什么要高16位与低16位异或？

设计者为了提高在计算index时的效率，没有采用取余（%）的方式计算index，而是采用了位运算，通过hash与数组大小-1（数组大小总是为 $2^n$ ）相与(&)得到；

但是这样在数组较小的情况下容易产生Hash冲突，数组大小为16时，参与运算的只有hash的末尾4位，一共就只有15个值；

所以在综合考虑了速度和质量的情况下让高16位也参与运算，在保证效率的同时一定程度上降低了Hash冲突出现的可能性；
HashMap是线程安全的吗？

不是，在两个线程同时put时会出现线程A的元素覆盖线程B元素的问题;

假设根据线程A，B想要插入的元素的Key，计算得到的在数组中的index相同；A线程先拿到了在那个index的链尾元素的引用，这时线程A的时间片用完；线程B执行，并成功地插入了元素，之后线程A继续执行，于是将链尾元素的引用指向了自己的元素，线程B的元素就被抛弃掉了，造成了线程A对线程B结果的覆盖；

HashMap笔记

HashMap

介绍

HashMap的工作原理

相关问题

猜你喜欢

热点阅读