ConcurrentHashMap的扩容

2021-01-06 本文已影响0人 HannahLi_9f1c

一、触发扩容的条件

addCount(put、remove、clear、computeIfAbsent、compute、merge)
数组长度>0.75n触发扩容

addCount中调用transfer

sizeCtl<0说明已经在扩容了
否则是第一个扩容，使用CAS更新sizeCtl，保证只有一个线程第一次进入transfer方法，nextTable是null
tryPresize（putAll、treeifyBin）
treeifyBin触发tryPresize条件：链表长度>8并且数组大小小于64，则不树化而是尝试扩容

tryPresize调用transfer

可以看出来，跟上面调用tranfer的逻辑差不多
helpTransfer（putAll、remove、clear、computeIfAbsent、compute、merge）
f.hash=MOVED触发扩容，这里的MOVED是在扩容中的setTabAt会把ForwardingNode的hash置为MOVED

helpTransfer调用transfer

通过CAS将sizeCtl+1

二、扩容源码分析

sizeCtl的状态流转
未初始化：
sizeCtl=0：表示没有指定初始容量。
sizeCtl>0：表示初始容量。
初始化中：
sizeCtl=-1,标记作用，告知其他线程，正在初始化
正常状态：
sizeCtl=0.75n ,扩容阈值
扩容中:
sizeCtl < 0 : 表示有其他线程正在执行扩容
sizeCtl = (resizeStamp(n) << RESIZE_STAMP_SHIFT) + 2 :表示此时只有一个线程在执行扩容
sizeCtl含义：

sizeCtl变化

https://blog.csdn.net/unknownfuture/article/details/105350537

transferIndex的作用
表示扩容的位移，多线程会修改这个值，因此是volatile类型，通过CAS修改，初始值是n数组大小，每次减去步长大小

修改transferindex
transfer

//该方法通过全局的transferIndex来控制每个线程的迁移任务
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        //n为旧tab的长度，stride为步长(就是每个线程迁移的节点数)
        int n = tab.length, stride;
        //单核步长为1，多核为（n>>>3）/ NCPU,最小值为16
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
        if (nextTab == null) {            // initiating
            try {
                @SuppressWarnings("unchecked")
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                nextTab = nt;
            } catch (Throwable ex) {      // try to cope with OOME
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            //nextTable为全局属性
            nextTable = nextTab;
            //transferIndex也为全局属性，用于控制迁移位置
            transferIndex = n;
        }
        int nextn = nextTab.length;
        //ForwardingNode是正在被迁移的Node，它的key，value，next都为null
        //hash为MOVED，其中有个nextTable属性指向新tab[]
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
        //advance为true，可以继续迁移下一个节点，false则停止迁移
        boolean advance = true;
        //是否结束迁移
        boolean finishing = false; // to ensure sweep before committing nextTab
        //i是当前迁移位置的索引，bound是迁移的边界，是从后往前的顺序
        for (int i = 0, bound = 0;;) {
            Node<K,V> f; int fh;
            while (advance) {
                int nextIndex, nextBound;
                //while循环迁移的--（减减）条件，第一个条件一直为true，finishing为true则迁移任务结束
                if (--i >= bound || finishing)
                    advance = false;
                //transferIndex（上一次迁移的边界）赋值给nextIndex（必执行），这里transferIndex一旦小于等于0
                //则说明原数组的所有位置的迁移都有相应的线程去处理了，该线程可以不用迁移了
                else if ((nextIndex = transferIndex) <= 0) {
                    i = -1;
                    advance = false;
                }
                //将nextBound赋值给transferIndex，nextBound = nextIndex - stride（上一个边界减去步长）
                //i = nextIndex - 1（上一个边界-1变成开始迁移的位置）
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {
                    bound = nextBound;
                    i = nextIndex - 1;
                    advance = false;
                }
            }
            //i < 0说明所有迁移任务完成了
            if (i < 0 || i >= n || i + n >= nextn) {
                int sc;
                //所有迁移完成，将nextTable设为空，sizeCtl为新tab.length * 0.75
                if (finishing) {
                    nextTable = null;
                    table = nextTab;
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                //该线程完成迁移，sizeCtl - 1，对应之前helpTransfer()中+1
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                    //不相等说明还有其他线程没完成迁移，该线程结束任务
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    //如果相等，则说明说有线程都完成任务了，设置finish为true
                    finishing = advance = true;
                    i = n; // recheck before commit
                }
            }
            //如果旧tab[i]为null，则放入ForwardingNode
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
            //如果该节点为ForwardingNode，则说明已经被迁移过了，就可以开始迁移下一个节点了
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else {
                //迁移开始加锁，这部分和1.8HashMap差不多，将一条链表拆分成两条
                //建议去看看1.8HashMap的扩容代码，好懂一点
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        Node<K,V> ln, hn;
                        //fh >= 0,说明是链表结构
                        //这个涉及到spread()方法，得到的hash值最高位必为0，则是正数
                        if (fh >= 0) {
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
                                int b = p.hash & n;
                                if (b != runBit) {
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) {
                                ln = lastRun;
                                hn = null;
                            }
                            else {
                                hn = lastRun;
                                ln = null;
                            }
                            for (Node<K,V> p = f; p != lastRun; p = p.next) {
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            //将该位置放入ForwardingNode
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        else if (f instanceof TreeBin) {
                            TreeBin<K,V> t = (TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                    (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            //一分为二后如果节点数小于树化阈值，则将红黑树转回链表
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            //将该位置放入ForwardingNode
                            setTabAt(tab, i, fwd);
                            //advance设置为true，说明该位置的迁移已经完成了
                            advance = true;
                        }
                    }
                }
            }
        }
    }

加锁部分的迁移逻辑：

使用fn&n可以快速把链表中的元素区分成两类，A类是hash值的第X位为0，B类是hash值的第X位为1，并通过lastRun记录最后需要处理的节点，A类和B类节点可以分散到新数组的槽位14和30中，在原数组的槽位14中，蓝色节点第X为0，红色节点第X为1，把链表拉平显示如下：

image

1、通过遍历链表，记录runBit和lastRun，分别为1和节点6，所以设置hn为节点6，ln为null；
2、重新遍历链表，以lastRun节点为终止条件，根据第X位的值分别构造ln链表和hn链表：

ln链：和原来链表相比，顺序已经不一样了

image

hn链：

image

通过CAS把ln链表设置到新数组的i位置，hn链表设置到i+n的位置；

7、如果该槽位是红黑树结构，则构造树节点lo和hi，遍历红黑树中的节点，同样根据hash&n算法，把节点分为两类，分别插入到lo和hi为头的链表中，根据lo和hi链表中的元素个数分别生成ln和hn节点，其中ln节点的生成逻辑如下：
（1）如果lo链表的元素个数小于等于UNTREEIFY_THRESHOLD，默认为6，则通过untreeify方法把树节点链表转化成普通节点链表；
（2）否则判断hi链表中的元素个数是否等于0：如果等于0，表示lo链表中包含了所有原始节点，则设置原始红黑树给ln，否则根据lo链表重新构造红黑树。
https://www.jianshu.com/p/f6730d5784ad
https://blog.csdn.net/b410604224/article/details/91345265

三、扩容的影响，可优化

影响正常put等操作
get时候可以从新旧两个数组取。
带参初始化，避免扩容

四、对比Redis的扩容

Redis的扩容是维护了一个rehashidx，每次CRUD的时候都迁移一个节点，然后rehashidx+1，这样的好处是避免了大规模扩容，导致的阻塞，而ConcurrentHashMap没有采用这样的方式，主要原因还是能够多线程扩容，充分利用CPU资源，当put、get、remove的时候都会增加一个线程扩容。但是大规模扩容也会引起阻塞

ConcurrentHashMap的扩容

一、触发扩容的条件

二、扩容源码分析

三、扩容的影响，可优化

四、对比Redis的扩容

猜你喜欢

热点阅读