LinkedHashMap 详解及源码简析

2019-01-27 本文已影响14人仰简

一、前言

在 HashMap详解以及源码分析这篇文章中，对 HashMap 的实现原理进行了比较深入的分析。而在 HashMap 大家族中，另一个重要的且常常被拿来比较的类 LinkedHashMap 也非常的重要。相比较 HashMap，其最大的特点是其默认按插入顺序进行排序。

在阅读这篇文章之前，建义先过一遍 HashMap详解以及源码分析。正如 LinkedHashMap 是继承自 HashMap 一样，这篇文章也是基于 HashMap 进行分析。

二、代码分析

1. demo 及其简析

LinkedHashMap<String,String> linkedHashMap = new LinkedHashMap<>();

        linkedHashMap.put(null,"北京");
        linkedHashMap.put("beijing","北京");
        linkedHashMap.put("shanghai","上海");
        linkedHashMap.put("tianjin","天津");
        linkedHashMap.put("hangzhou","杭州");
        linkedHashMap.put("changsha","长沙");
        linkedHashMap.put("wuhan","武汉");
        linkedHashMap.put("guangzhou","广州");
        linkedHashMap.put("shenzhen","深圳");

        Set<LinkedHashMap.Entry<String,String>> sets = linkedHashMap.entrySet();
        for (LinkedHashMap.Entry<String,String> set : sets) {
            Log.d(TAG, "linkedHashMapSample: key = " + set.getKey() + ";value = " + set.getValue());
        }

demo 运行结果

linkedHashMapSample: key = null;value = 北京
linkedHashMapSample: key = beijing;value = 北京
linkedHashMapSample: key = shanghai;value = 上海
linkedHashMapSample: key = tianjin;value = 天津
linkedHashMapSample: key = hangzhou;value = 杭州
linkedHashMapSample: key = changsha;value = 长沙
linkedHashMapSample: key = wuhan;value = 武汉
linkedHashMapSample: key = guangzhou;value = 广州
linkedHashMapSample: key = shenzhen;value = 深圳

从运行结果可以看出，LinkedHashMap 输出的结果的顺序与其 put 时的顺序时一致的。

2.源码分析

LinkedHashMap 的类图结果在分析 HashMap 的时候已经有了解过，这里再复习一下Map大家族。

Map大家族简版.jpg

LinkedHashMap 的初始化

public LinkedHashMap(int initialCapacity, float loadFactor) {
        super(initialCapacity, loadFactor);
        accessOrder = false;
    }
public LinkedHashMap(int initialCapacity) {
        super(initialCapacity);
        accessOrder = false;
    }
public LinkedHashMap() {
        super();
        accessOrder = false;
    }
public LinkedHashMap(Map<? extends K, ? extends V> m) {
        super();
        accessOrder = false;
        putMapEntries(m, false);
    }
public LinkedHashMap(int initialCapacity,
                         float loadFactor,
                         boolean accessOrder) {
        super(initialCapacity, loadFactor);
        this.accessOrder = accessOrder;
    }

LinkedHashMap 根据参数的不同重载了 5 个不同的构造方法，但其作用基本相同，只是赋值一些默认值而已，如初始容量，负载因子以及是否按访问排序，其默认是按插入排序的。

LinkedHashMap 插入元素 put() 方法
LinkedHashMap 本身并没有实现，是共用父类 HashMap 的，也就是这个 put 方法是来自于 HashMap 的。在分析 HashMap 的时候已经了解，put() 又是进一步调用了 putVal() 方法，下面简单来过一下 putVal() 方法。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

putVal() 里面作的事情比较多，这里也再来复习一下。
(1)通过对 hash(key) 计算出来的 hash 值，计算出散列 index。

(2)如果没碰撞冲突直接放到 table 里。

(3)如果碰撞冲突了，先以链表的形式解决冲突，并把新的 node 插入到链尾。

(4)如果碰撞冲突导致链表过长(>= TREEIFY_THRESHOLD)，就把链表转换成红黑树，提高查询效率。

(5)如果节点已经存在，即key的 hash() 值相等且 key 的内容相等，就替换 old value，从而保证 key 的唯一性。

(6)如果 table 满了( > load factor*capacity)，就要扩容resize()。

这里 LinkedHashMap 差异的地方在于创建新的 Node，也就是 Entry，而 LinkedHashMap 的 Entry 也是不一样的，其有自己定义的 LinkedHashMapEntry。

    static class LinkedHashMapEntry<K,V> extends HashMap.Node<K,V> {
        LinkedHashMapEntry<K,V> before, after;
        LinkedHashMapEntry(int hash, K key, V value, Node<K,V> next) {
            super(hash, key, value, next);
        }
    }

LinkedHashMapEntry 继承自 HashMap.Node，在经基本上其增加了 before 以及 after 两个指针，以此便可以构造出一个双向链表。再来看看它的 newNode() 实现便可以知道它是如何构建双向链表的了。

    Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
        LinkedHashMapEntry<K,V> p =
            new LinkedHashMapEntry<K,V>(hash, key, value, e);
        linkNodeLast(p);
        return p;
    }

这里有个关键的调用 linkNodeLast() 方法。

private void linkNodeLast(LinkedHashMapEntry<K,V> p) {
        LinkedHashMapEntry<K,V> last = tail;
        tail = p;
        if (last == null)
            head = p;
        else {
            p.before = last;
            last.after = p;
        }
    }

先取出 tial 指针，再令当前节点为 tial 指针，然后当前指针指向 tial 指针，tail 指针又指向当前指针。意思就是当前的 tail 指针与当前指针 p 建立起前后指向关系，然后令当前的 p 指针为 tail 指针，从而便构造出了双向链表。

LinkedHashMap 获取元素 get() 方法与remove() 方法
LinkedHashMap 的 get() 方法与 remove() 方法基本与 HashMap 是一致的，只是在 remove() 时注意还要从 LinkedHashMapEntry 所构成的双向链表中将其也一并移除。
LinkedHashMap 的遍历
在分析 HashMap 的时候我们知道，遍历最主要的实现在集合自己所实现的 Iterator 中，而 Iterator 中最关键的又在 nextNode() 方法中。

final LinkedHashMapEntry<K,V> nextNode() {
            LinkedHashMapEntry<K,V> e = next;
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            if (e == null)
                throw new NoSuchElementException();
            current = e;
            next = e.after;
            return e;
        }

从代码里可以看出，这就是对一个链接进行遍历的基本操作了，这里根本就不需要考虑到 key 以及 value 本身是如何存储的，而只是通过链表进行基本的遍历就可以了。

三、总结

在了解了 HashMap 的原理后，再来看 LinkedHashMap 的话是非常简单的。LinkedHashMap 是继承自 HashMap 的，所以 LinkedHashMap 包含了 HashMap 所有的功能以及特性。而在此基础上，LinkedHashMap 又将每个 LinkedHashMapEntry 链接成了一个双向链表。而我们之所以能得到一个有序的结果输出，其原因就在于其 Iterator 的实现。我们对 LinkedHashMap 的遍历就是对 LinkedHashMapEntry 所构成的链表进行遍历。默认情况下，链表就是按照插入顺序进行构造的，新插入的结点都会被放到 tial，这也就是自然保证了插入时的顺序了。

最后，感谢你能读到并读完此文章，如果分析的过程中存在错误或者疑问都欢迎留言讨论。如果我的分享能够帮助到你，还请记得帮忙点个赞吧，谢谢。