集合-HashMap解析

2017-09-15  本文已影响0人  史云龙

一、概述

  1. HashMap的底层数据结构是数组,但是数组中存放的并不是一个对象而是链表。所以也可以成HashMap的数据结构是哈希桶。在JDK1.8中如果链表存放的元素超过8个就将链表转换成红黑树。为了保证元素冲突时,查询和插入效率。Andro中则一直是链表。数组每一位存储的是链表的头部。链表的使用时基于哈希表解决冲突(碰撞)使用的方法:链地址法
  2. HashMap默认数组长度(Android:2然后在第一次增加数据后就变成了4,Java:16),默认扩容长度为原来数组长度的一半,数组长度也称容量。在数组内元素超过阈时,就会进行扩容。阈=负载系数数组长度。负载系数可以自定义也可以使用默认值0.75*;
  3. 关于hash计算:通过使用key的hashCode(),然后经过哈希函数将hashCode转换为相应哈希值,通过位运算来计算应该放在表中的哪个位置,位运算效率高于取模运算。哈希函数尽量使得数据的分布均匀。HashMap的Key对象尽量需要复写父类的hashCode()和equals()方法,这两个方法主要用于HashMap中存储。
    其中hashCode用于hash值及表中位置的位运算。equals用于判断key值是否相等。
  4. 关于扩容以及扩容后的数据位置转换。首先判断是否需要扩容。需要扩容,那么容量变为原来的两倍。扩容后数据需要判断是否需要向数组的高位移动,判断方式是元素的hash值与上数组原来的长度(hash&oldCap),如果不为0就需要向高位移动。高位的位置是现在的位置加上oldCap(原来的数组长度)。
  5. HashMap中重要的两个参数是容量(Capacity)和负载系数(Load factor)。其中容量是指桶的数目,负载系数是在桶填满程度的最大比例。这两个参数关系到了哈希表的性能。Android中负载因子没有用。。。

二、构造函数及节点信息

2.1 构造函数

关键字transient表示实现接口Serializable的对象字段不能被自动序列化

Java

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;//默认初始化容量,16
static final int MAXIMUM_CAPACITY = 1 << 30;//最大容量:2的30次方
static final float DEFAULT_LOAD_FACTOR = 0.75f;//默认负载系数:0.75
transient Node<K,V>[] table;//表,Node数组
transient Set<Map.Entry<K,V>> entrySet;//Map的Entry
transient int size;//大小
transient int modCount;//修改次数
int threshold;//阈,负载系数*容量
final float loadFactor;//负载系数,可自定义
//自定义初始化容量和负载系数的构造函数
public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)//如果初始化容量小于0,抛出异常
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)//如果初始化容量大于最大容量,那么将初始化容量设为最大容量
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))//负载系数小于0或者是空
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;//设置负载系数
        this.threshold = tableSizeFor(initialCapacity);//设置阈,在第一次put的时候将表的容量设为当前的阈值,并重新修改阈值
}
//只有初始化容量的构造函数
public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
//默认构造函数,只是将负载因子设为默认参数
public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
//参数是Map的构造参数
public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;//设置负载因子,为默认因子
        putMapEntries(m, false);//将map的数据插入进去
}
//将cap的所有除最高位外变为1,然后+1,这样就变成了大于等于cap的2的n次方
static final int tableSizeFor(int cap) {
        int n = cap - 1;//减1,方便处理最高位的值,假定最高位为m,最高位指的是int的二进制表示最高(第一个)1出现的位置,如果这个值的二进制是m位为1,而其他位为0的情况,类似与(10000=16),就是2的n次方。
        n |= n >>> 1;//将m-1位置处理为1
        n |= n >>> 2;//将m-1到m-4位置处理为1
        n |= n >>> 4;//将m-1到m-8位置处理为1
        n |= n >>> 8;//将m-1到m-16位置处理为1
        n |= n >>> 16;//将m-1到m-32位置处理为1
        //其实就是将最高位外全部处理为1,具体参考下图演示的0,15,16,17
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
位运算

Android

private static final int MINIMUM_CAPACITY = 4;//最小的数组长度
private static final int MAXIMUM_CAPACITY = 1 << 30;
private static final Entry[] EMPTY_TABLE
            = new HashMapEntry[MINIMUM_CAPACITY >>> 1];//空数组,长度为2
static final float DEFAULT_LOAD_FACTOR = .75F;//默认的负载因子
transient HashMapEntry<K, V>[] table;//表,使用HashMapEntry的表
transient HashMapEntry<K, V> entryForNullKey;//专门存储null键的键值对对象
transient int size;//size
transient int modCount;//修改次数
private transient int threshold;//阈
private transient Set<K> keySet;//key的集合
private transient Set<Entry<K, V>> entrySet;//entry的集合
private transient Collection<V> values;//值的集合

public HashMap() {//默认构造函数
        table = (HashMapEntry<K, V>[]) EMPTY_TABLE;//将table设置空数组
        //阈,在第一次增加元素的时候会进行数组扩容,数组长度也就变成了4
        threshold = -1; // Forces first put invocation to replace EMPTY_TABLE
}
//设置初始容量的构造函数
public HashMap(int capacity) {
        if (capacity < 0) {//如果容量小于0,抛出异常
            throw new IllegalArgumentException("Capacity: " + capacity);
        }

        if (capacity == 0) {//如果容量为0
            @SuppressWarnings("unchecked")
            HashMapEntry<K, V>[] tab = (HashMapEntry<K, V>[]) EMPTY_TABLE;
            table = tab;//将table设为空数组
            threshold = -1; // Forces first put() to replace EMPTY_TABLE,阈值设为-1,为了第一次增加数据时扩容
            return;
        }
        //容量小于最小容量,就将容量设置最小容量
        if (capacity < MINIMUM_CAPACITY) {
            capacity = MINIMUM_CAPACITY;
        } else if (capacity > MAXIMUM_CAPACITY) {//容量大于最大容量,就设为最大容量
            capacity = MAXIMUM_CAPACITY;
        } else {//变成2的n次方
            capacity = Collections.roundUpToPowerOfTwo(capacity);
        }
        //创建数组,阈值为数组的0.75
        makeTable(capacity);
}
//设置初始容量,负载因子没有用
public HashMap(int capacity, float loadFactor) {
        this(capacity);//调用容量函数,负载因子并没有用,只是为了符合java的构造方法
        if (loadFactor <= 0 || Float.isNaN(loadFactor)) {
            throw new IllegalArgumentException("Load factor: " + loadFactor);
        }
}
//Map的数组
public HashMap(Map<? extends K, ? extends V> map) {
        this(capacityForInitSize(map.size()));//调用容量相关的构造函数
        constructorPutAll(map);
}
//使用容量,制造数组
private HashMapEntry<K, V>[] makeTable(int newCapacity) {
        @SuppressWarnings("unchecked") 
      HashMapEntry<K, V>[] newTable
                = (HashMapEntry<K, V>[]) new HashMapEntry[newCapacity];
        table = newTable;//将数组设为新创建的数组
        //调整阈值
        threshold = (newCapacity >> 1) + (newCapacity >> 2); // 3/4 capacity
        return newTable;
}
static int capacityForInitSize(int size) {
         //将size扩容一半
        int result = (size >> 1) + size; // Multiply by 3/2 to allow for growth
        //~(MAXIMUM_CAPACITY-1)=1<<31 + 1<<30
        // (result & ~(MAXIMUM_CAPACITY-1))==0 ,true表示小于1<<30
        // boolean expr is equivalent to result >= 0 && result<MAXIMUM_CAPACITY
        return (result & ~(MAXIMUM_CAPACITY-1))==0 ? result : MAXIMUM_CAPACITY;
}

Collections.java

//具体的算法,和Java中相同
public static int roundUpToPowerOfTwo(int i) {
        i--; // If input is a power of two, shift its high-order bit right.
        // "Smear" the high-order bit all the way to the right.
        i |= i >>>  1;
        i |= i >>>  2;
        i |= i >>>  4;
        i |= i >>>  8;
        i |= i >>> 16;
        return i + 1;
}

2.2 节点对象

Java

Java在1.8中有两种Node节点:普通Node(用于桶的链表)和树的Node(用于红黑树节点)
TreeNode的节点继承自普通Node(在JDK1.8中实际是孙子)。
普通Node

static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;//哈希值
        final K key;//Key
        V value;//值
        Node<K,V> next;//下一个节点

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
        //获取Key
        public final K getKey()        { return key; }
        public final V getValue()      { return value; }//获取值
        public final String toString() { return key + "=" + value; }//转换成字符串

        public final int hashCode() {//哈希值
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }
        //设置值
        public final V setValue(V newValue) {
            V oldValue = value;//老值
            value = newValue;//值设置为新值
            return oldValue;//返回老值
        }
        //判断是否相等
        public final boolean equals(Object o) {
            if (o == this)//是否相等
                return true;
            if (o instanceof Map.Entry) {//判断对象是否是Map的键值对
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;//将对象转换成相应的对象
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;//key和值相等,键值对相等。
            }
            return false;
        }
}

红黑树的Node
这个红黑树使用Hash值进行比较,如果Hash相同,那么再使用key值进行比较。key值需要比较功能。
红黑树的增加删除需要平衡树,关于红黑树,参考链接内的内容。

红黑树的根节点放入哈希表中。

关于节点为啥不讲红黑树节点:因为也没太看懂Java代码。这里的红黑树表现会比较复杂。

TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
}

Android

HashMap条目,链表的节点

static class HashMapEntry<K, V> implements Entry<K, V> {
        final K key;
        V value;
        final int hash;//哈希值
        HashMapEntry<K, V> next;//下一个节点

        HashMapEntry(K key, V value, int hash, HashMapEntry<K, V> next) {
            this.key = key;
            this.value = value;
            this.hash = hash;
            this.next = next;
        }
        public final K getKey() {//获取Key
            return key;
        }
        public final V getValue() {//获取值
            return value;
        }
        public final V setValue(V value) {//设置值
            V oldValue = this.value;
            this.value = value;
            return oldValue;
        }
        @Override 
      public final boolean equals(Object o) {//判断是否相等
            if (!(o instanceof Entry)) {
                return false;
            }
            Entry<?, ?> e = (Entry<?, ?>) o;//key和value相等,那么Entry相等
            return Objects.equal(e.getKey(), key)
                    && Objects.equal(e.getValue(), value);
        }
        @Override public final int hashCode() {//哈希值
            return (key == null ? 0 : key.hashCode()) ^
                    (value == null ? 0 : value.hashCode());
        }
        @Override public final String toString() {//转换成字符串
            return key + "=" + value;
        }
}

三、增加元素

3.1 增一个元素:增加一个键值对

将一个元素放入哈希表

Java

public V put(K key, V value) {
        //根据key的hashCode(),求出key的哈希值。
        return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //如果tab是空,或者tab的长度为0,需要扩容
       //默认构造函数创建的table就是空
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;//tab重新设置大小,并将长度赋值
        if ((p = tab[i = (n - 1) & hash]) == null)//计算key对应hash位置是否为空
            tab[i] = newNode(hash, key, value, null);//如果为空表示,这个位置没有值,直接设置新值即可。
        else {
            Node<K,V> e; K k;//
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;//哈希值、key相等表示放入的键值对需要修改
            else if (p instanceof TreeNode)//如果是树节点,就采用红黑树的插入方法
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {//链表的插入方法
                for (int binCount = 0; ; ++binCount) {//循环链表
                    if ((e = p.next) == null) {//将p向后移动,直到p.next空
                        p.next = newNode(hash, key, value, null);//将p的后节点指向新创建的节点
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);//如果count=7,表示插入之后达到了8个,将数据结构换成链表
                        break;
                    }//如果值相等,打断循环
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }//如果e不为空,表示找到了e,将e的值修改掉。
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;//增加修改次数
        if (++size > threshold)//如果size大于阈值,需要进行扩容。
            resize();
        afterNodeInsertion(evict);
        return null;
}
final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;//老table
        int oldCap = (oldTab == null) ? 0 : oldTab.length;//老的容量
        int oldThr = threshold;//老的阈值
        int newCap, newThr = 0;//新的长度和新的阈值
        if (oldCap > 0) {//如果老表的长度大于0
            if (oldCap >= MAXIMUM_CAPACITY) {//如果老的容量大于设定的最大容量
                threshold = Integer.MAX_VALUE;//将阈值设为Integer的最大值,2的31次方-1;
                return oldTab;//返回老表
            }//新容量=老容量*2,如果新容量小于最大容量值并且老容量大于等于默认容量值
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold,将阈值double之后直接设为新阈值
        }//如果老阈值大于零,并且老的容量小于0,将初始容量设为阈值
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;//构造函数使用设置初始容量相关的函数
        else {               // zero initial threshold signifies using defaults
            //默认构造函数,第一执行put操作的时候。
            newCap = DEFAULT_INITIAL_CAPACITY;//将容量设置为初始容量
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//新的阈值为默认的负载因子*容量
        }
        if (newThr == 0) {//如果新的阈值为0,重新设定新阈值
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;//将阈值赋值
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//创建新的数组
        table = newTab;//将table指向新创建的数组
        if (oldTab != null) {//如果老数组不为空
            for (int j = 0; j < oldCap; ++j) {//循环遍历数组
                Node<K,V> e;//临时记录节点
                if ((e = oldTab[j]) != null) {//记录数组中相应位置的节点,并判断是否为空,如果为空,直接跳过。不为空才进行处理
                    oldTab[j] = null;//将老数组中相应位置元素置空
                    if (e.next == null)//如果e没有下一个元素,表示这个数组内放置的只有一个元素
                        newTab[e.hash & (newCap - 1)] = e;//将元素移动到新数组对应位置即可
                    else if (e instanceof TreeNode)//如果节点是树,那么久使用红黑树的拆分
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order,链表的拆分
                        Node<K,V> loHead = null, loTail = null;//低位区,头尾“指针”
                        Node<K,V> hiHead = null, hiTail = null;//高位区,头尾“指针”
                        Node<K,V> next;//下一个
                        do {
                            next = e.next;//将next后移,然后处理e
                            if ((e.hash & oldCap) == 0) {//如果计算结果值为0,表示处于低位
                                if (loTail == null)//没有尾指针
                                    loHead = e;//将头部指针指向e
                                else//将尾部的下一个指向e
                                    loTail.next = e;
                                loTail = e;//将尾部指针指向e
                            }
                            else {//如果计算结果不为0,表示处于高位
                                if (hiTail == null)//高位头指针为空
                                    hiHead = e;//高位头指针指向e
                                else//高位头指针不为空
                                    hiTail.next = e;//高位尾指针下一个指向e
                                hiTail = e;//高位尾指针移向e
                            }
                        } while ((e = next) != null);//将e重新指向空指针
                        if (loTail != null) {//低位尾指针不为空
                            loTail.next = null;//将尾指针下一位置空
                            newTab[j] = loHead;//将对应新数组位置设置为低位头指针
                        }
                        if (hiTail != null) {//如果高位尾指针不为空
                            hiTail.next = null;//将高位尾指针下一位置空
                            newTab[j + oldCap] = hiHead;//将新数组高位对应位置指向高位尾指针。
                        }
                    }
                }
            }
        }//如果为空,直接返回新创建的数组
        return newTab;
}

static final int hash(Object key) {
        int h;
        //如果key不为null,将key的hashCode亦或上key的HashCode
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

 Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {
        return new Node<>(hash, key, value, next);
}

JDK1.8的相关代码

HashMap<Integer, Integer> hp = new HashMap<>();
hp.put(0, 0);
hp.put(16, 16);
hp.put(32, 32);//0,16,32,在没有扩容前,都放在0位置上
hp.put(1, 1);
hp.put(31, 16);
hp.put(2, 2);
hp.put(3, 3);
hp.put(4, 4);
hp.put(5, 5);
hp.put(6, 6);
hp.put(7, 7);
hp.put(8, 8);//此时size是12 ,容量是16,在插入9之后进行扩容
hp.put(9, 9);//在扩容后,16因为需要变化需要重新换位置,换到了高位上。

关于容量从16变化到32
判断是否需要重新换位置的标准是(hash&新容量-1)是否可以在原来的位置上。
但是上面的判断变化非常复杂,从而采用了一种简单的变化标准,就是下图中的变化。
其实判断的核心标准在于新增的高位变化了1,就是从原来的判断4位到判断5位。就是最高位的判断。其中判断新变化的第5位是否是1即可,因为是1表示需要移动位置。因为容量变为32之后,位置考虑的也只是hash值后5位。所以hash&oldCap!=0就是表示需要换位的相关元素,将它们拼成新的链表

关于新位置为什么使用[j + oldCap],是因为只变化了最高位,这个最高位为1低位全为0在二进制上表示就oldCap

哈希表中链表扩容相关位运算

Android

使用了一个固定的节点对象,来存储null键的情况。
没有特别复杂的算法,一切都是看起来那么简单。。。

@Override public V put(K key, V value) {
        if (key == null) {//插入空键
            return putValueForNullKey(value);
        }
        //计算Hash值,这个hash值的计算需要
        int hash = Collections.secondaryHash(key);
        HashMapEntry<K, V>[] tab = table;
        int index = hash & (tab.length - 1);//计算表中的位置
        for (HashMapEntry<K, V> e = tab[index]; e != null; e = e.next) {//判断这位置是否有数据,如果没有向后移动
            if (e.hash == hash && key.equals(e.key)) {//找到hash值相等和key相等的数据
                preModify(e);//预修改数据
                V oldValue = e.value;//找到了,修改数据
                e.value = value;
                return oldValue;
            }
        }
        // No entry for (non-null) key is present; create one
        modCount++;
        if (size++ > threshold) {//如果size增加后,大于了阈值
            tab = doubleCapacity();//容量扩容
            index = hash & (tab.length - 1);//修改位置
        }
        addNewEntry(key, value, hash, index);//新增加键值对
        return null;
    }

    private V putValueForNullKey(V value) {
        HashMapEntry<K, V> entry = entryForNullKey;//空键节点
        if (entry == null) {//如果不存在空键节点,创建一个
            addNewEntryForNullKey(value);
            size++;
            modCount++;
            return null;
        } else {//如果存在空键节点,修改空键节点
            preModify(entry);//预修改,主要针对LinkeHash修改的方法,在HashMap中是空方法。
            V oldValue = entry.value;//修改值
            entry.value = value;
            return oldValue;
        }
    }
  void addNewEntryForNullKey(V value) {
        //创建一个空键的HashMapEntry
        entryForNullKey = new HashMapEntry<K, V>(null, value, 0, null);
    }
void preModify(HashMapEntry<K, V> e) { }
//在相应的位置创建一个新的条目即可
void addNewEntry(K key, V value, int hash, int index) {
        table[index] = new HashMapEntry<K, V>(key, value, hash, table[index]);
}
//扩容,双倍扩容
private HashMapEntry<K, V>[] doubleCapacity() {
        HashMapEntry<K, V>[] oldTable = table;//老表
        int oldCapacity = oldTable.length;//老容量
        if (oldCapacity == MAXIMUM_CAPACITY) {//如果老的容量已经等于最大值就返回老表
            return oldTable;
        }
        int newCapacity = oldCapacity * 2;//新容量=老容量扩大2倍,因为初始容量都是2的倍数,最大容量也是2的倍数,所以扩容后不会超过
        HashMapEntry<K, V>[] newTable = makeTable(newCapacity);//确保新表容量是2的倍数
        if (size == 0) {//如果size=0,不需要处理表中的数据
            return newTable;//直接将新表返回
        }
        for (int j = 0; j < oldCapacity; j++) {//遍历老表
            /*
             * Rehash the bucket using the minimum number of field writes.
             * This is the most subtle and delicate code in the class.
             */
            HashMapEntry<K, V> e = oldTable[j];//记录位置的数据
            if (e == null) {//如果数据为空,继续
                continue;
            }
            int highBit = e.hash & oldCapacity;//链表首位数据高位的bit,其他位全是0
            HashMapEntry<K, V> broken = null;//相等于尾节点
            newTable[j | highBit] = e;// j | highBit等于j+highBit,因为j和highBit的位值有差异
            //循环链表
            for (HashMapEntry<K, V> n = e.next; n != null; e = n, n = n.next) {
                int nextHighBit = n.hash & oldCapacity;//计算链表其他数据的bit
                if (nextHighBit != highBit) {//如果不相等,表示需要移动位置
                    if (broken == null)//如果broken为空,表示没有移动过
                        newTable[j | nextHighBit] = n;//直接移动数据即可
                    else//移动过数据,就将broken的后位置为n即可
                        broken.next = n;
                    broken = e;//将broken指向e,具体参考下图的演示
                    highBit = nextHighBit;//将高位置移动
                }
            }
            if (broken != null)//如果broken不为空,将broken的后续节点指向空
                broken.next = null;
        }
        return newTable;
    }

Collections.java

public static int secondaryHash(Object key) {
        return secondaryHash(key.hashCode());
}
private static int secondaryHash(int h) {
        // Spread bits to regularize both segment and index locations,
        // using variant of single-word Wang/Jenkins hash.
        h += (h <<  15) ^ 0xffffcd7d;
      //-12931
      //1111 1111 1111 1111 1100 1101 0111 1101
        h ^= (h >>> 10);
        h += (h <<   3);
        h ^= (h >>>  6);
        h += (h <<   2) + (h << 14);
        return h ^ (h >>> 16);
}
Android中扩容时链表处理

3.2 增加Map中的元素

Java

public void putAll(Map<? extends K, ? extends V> m) {
        putMapEntries(m, true);
}
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
        int s = m.size();
        if (s > 0) {//map中的数据大于0个
            if (table == null) { // pre-size,主要针对空数组预加载阈值
                float ft = ((float)s / loadFactor) + 1.0F;//这个值是map种的容量
                int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                         (int)ft : MAXIMUM_CAPACITY);//设定容量
                if (t > threshold)//如果map中容量超过阈值,修改阈值
                    threshold = tableSizeFor(t);
            }
            else if (s > threshold)//如果容量查过阈值,那么修改扩容
                resize();
            //遍历,并将map中数据插入到HashMap中
            for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
                K key = e.getKey();
                V value = e.getValue();
                putVal(hash(key), key, value, false, evict);
            }
        }
    }

Android

循环一个个增加元素

 @Override public void putAll(Map<? extends K, ? extends V> map) {
        ensureCapacity(map.size());//确保容量足够
        super.putAll(map);//调用父类的putAll方法
    }
private void ensureCapacity(int numMappings) {
        int newCapacity = Collections.roundUpToPowerOfTwo(capacityForInitSize(numMappings));//将容量扩容
        HashMapEntry<K, V>[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (newCapacity <= oldCapacity) {//确保需要的容量小于已有容量,直接返回
            return;
        }
        if (newCapacity == oldCapacity * 2) {//如果新容量是老容量的2倍
            doubleCapacity();//直接扩容,然后返回
            return;
        }

        // We're growing by at least 4x, rehash in the obvious way
        HashMapEntry<K, V>[] newTable = makeTable(newCapacity);
       //新创建数组
        if (size != 0) {
            int newMask = newCapacity - 1;//新容量-1
            for (int i = 0; i < oldCapacity; i++) {
                for (HashMapEntry<K, V> e = oldTable[i]; e != null;) {
                    HashMapEntry<K, V> oldNext = e.next;//记录e的后节点
                    int newIndex = e.hash & newMask;//计算新位置
                    HashMapEntry<K, V> newNext = newTable[newIndex];//记录新位置的数据
                    newTable[newIndex] = e;//将新位置的数据设为e
                    e.next = newNext;//将e后继指向原来新位置的数据
                    e = oldNext;//将e指向原来e的后继,循环链表
                }
            }
        }
    }

AbstractMap.java

public void putAll(Map<? extends K, ? extends V> map) {
        for (Map.Entry<? extends K, ? extends V> entry : map.entrySet()) {
            put(entry.getKey(), entry.getValue());
        }
}

四、删除元素

4.1删除Key相等的元素

在key相等的情况下就删除元素,默认的删除元素的方法
还有一个删除key相等和Value相等的元素方法

public V remove(Object key) {
        Node<K,V> e;
        return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
}

public boolean remove(Object key, Object value) {
        return removeNode(hash(key), key, value, true, true) != null;
}
//哈希值、键、值、是否需要值相等、移动的(用于红黑树)?
final Node<K,V> removeNode(int hash, Object key, Object value,
                               boolean matchValue, boolean movable) {
        //表,相应位置p节点,表长度,位置
        Node<K,V>[] tab; Node<K,V> p; int n, index;
        //表不为空,表长度大于0,表相应位置元素不为空
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (p = tab[index = (n - 1) & hash]) != null) {
            //需要删除的节点
            Node<K,V> node = null, e; K k; V v;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                node = p;//hash值相等和key相等,表示找到了元素
            else if ((e = p.next) != null) {//没有直接找到元素,处理链表或红黑树
                if (p instanceof TreeNode)//处理红黑树,找到节点
                    node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                else {//处理链表
                    do {//找到hash和key相等的记录为node
                        if (e.hash == hash &&
                            ((k = e.key) == key ||
                             (key != null && key.equals(k)))) {
                            node = e;
                            break;
                        }
                        p = e;//删除位置前的元素
                    } while ((e = e.next) != null);
                }
            }
            //判断是否可以删除
           // 节点不为空,是否需要值相等
            if (node != null && (!matchValue || (v = node.value) == value ||
                                 (value != null && value.equals(v)))) {
                if (node instanceof TreeNode)//删除树的节点
                    ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                else if (node == p)//如果删除的是链表的头节点
                    tab[index] = node.next;//将数组指向链表的下一位置即可
                else//将前节点的后继指向删除节点的后继
                    p.next = node.next;
                ++modCount;//修改次数增加
                --size;//size减小
                afterNodeRemoval(node);//LinkeHashMap使用
                return node;
            }
        }
        return null;
}

Android

@Override public V remove(Object key) {
        if (key == null) {//如果key等于null,调用null的删除方法
            return removeNullKey();//移除空元素
        }
        int hash = Collections.secondaryHash(key);//计算Hash值
        HashMapEntry<K, V>[] tab = table;//表
        int index = hash & (tab.length - 1);//计算位置
        //循环链表,记录节点的前节点
        for (HashMapEntry<K, V> e = tab[index], prev = null;
                e != null; prev = e, e = e.next) {
            //hash值相等和key相等,表示找到了元素,
            if (e.hash == hash && key.equals(e.key)) {
                if (prev == null) {//如果没有前节点,表示需要删除的链表的尾节点
                    tab[index] = e.next;
                } else {//如果有将前节点的后节点指向新的后节点
                    prev.next = e.next;
                }
                modCount++;//修改次数增加
                size--;//size-1
                postRemove(e);//预删除
                return e.value;
            }
        }
        return null;
    }
private V removeNullKey() {
        HashMapEntry<K, V> e = entryForNullKey;
        if (e == null) {//如果e为null,表示没有存储空键值的元素
            return null;
        }
        entryForNullKey = null;//将空元素置为空
        modCount++;//修改次数
        size--;//size减小
        postRemove(e);//预删除,子类可以能有相应取消连接的实现
        return e.value;
}
void postRemove(HashMapEntry<K, V> e) { }

五、修改元素

Java

除put外还有replace相关方法,

@Override
public V replace(K key, V value) {
        Node<K,V> e;
        //找到节点病替换节点的值
        if ((e = getNode(hash(key), key)) != null) {
            V oldValue = e.value;
            e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
        return null;
}

@Override
public boolean replace(K key, V oldValue, V newValue) {
        Node<K,V> e; V v;
        //找到key和value都相等的节点,替换这个节点的值
        if ((e = getNode(hash(key), key)) != null &&
            ((v = e.value) == oldValue || (v != null && v.equals(oldValue)))) {
            e.value = newValue;
            afterNodeAccess(e);
            return true;
        }
        return false;
}

@Override
public void replaceAll(BiFunction<? super K, ? super V, ? extends V> function) {
        Node<K,V>[] tab;
        if (function == null)
            throw new NullPointerException();
        if (size > 0 && (tab = table) != null) {
            int mc = modCount;
            //循环遍历数组,处理数组中的数据
            for (int i = 0; i < tab.length; ++i) {
                for (Node<K,V> e = tab[i]; e != null; e = e.next) {
                    e.value = function.apply(e.key, e.value);
                }
            }
            if (modCount != mc)
                throw new ConcurrentModificationException();
        }
}

Android

没有replace相关的API

六、查询元素

Java

public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
}
 @Override
public V getOrDefault(Object key, V defaultValue) {
        Node<K,V> e;//如果查找的结果为空,就返回给定的默认值
        return (e = getNode(hash(key), key)) == null ? defaultValue : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        //找到hash对相应位置的元素
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            //检查第一个节点key是否相等
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {//是否有后继节点
                if (first instanceof TreeNode)//如果是树形结构,调用树形结构的获取方法
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {//循环遍历链表,直到找到相应的节点
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
}

Android

除了红黑树外与Java没有特殊差异

public V get(Object key) {
        if (key == null) {
            HashMapEntry<K, V> e = entryForNullKey;
            return e == null ? null : e.value;
        }

        int hash = Collections.secondaryHash(key);
        HashMapEntry<K, V>[] tab = table;
        for (HashMapEntry<K, V> e = tab[hash & (tab.length - 1)];
                e != null; e = e.next) {
            K eKey = e.key;
            if (eKey == key || (e.hash == hash && key.equals(eKey))) {
                return e.value;
            }
        }
        return null;
}

七、其他

7.1 包含元素

Java

//包含Key
public boolean containsKey(Object key) {
        return getNode(hash(key), key) != null;
}
//是否包含值
public boolean containsValue(Object value) {
        Node<K,V>[] tab; V v;
        if ((tab = table) != null && size > 0) {
            //循环遍历数组、链表以及红黑树
            for (int i = 0; i < tab.length; ++i) {
                for (Node<K,V> e = tab[i]; e != null; e = e.next) {
                    if ((v = e.value) == value ||
                        (value != null && value.equals(v)))
                        return true;
                }
            }
        }
        return false;
}

Android

@Override 
public boolean containsKey(Object key) {
        if (key == null) {
            return entryForNullKey != null;
        }
        //计算hash值
        int hash = Collections.secondaryHash(key);
        HashMapEntry<K, V>[] tab = table;
        //遍历tab对应的链表
        for (HashMapEntry<K, V> e = tab[hash & (tab.length - 1)];
                e != null; e = e.next) {
            K eKey = e.key;
            if (eKey == key || (e.hash == hash && key.equals(eKey))) {
                return true;
            }
        }
        return false;
}
@Override 
public boolean containsValue(Object value) {
        HashMapEntry[] tab = table;
        int len = tab.length;
        if (value == null) {//如果值为空,先遍历数组中是否有null值,如果有返回true,如果没有查询空键值对中是否包含值
            for (int i = 0; i < len; i++) {
                for (HashMapEntry e = tab[i]; e != null; e = e.next) {
                    if (e.value == null) {
                        return true;
                    }
                }
            }
            return entryForNullKey != null && entryForNullKey.value == null;
        }
        // value is non-null,循环遍历判断是否包含相应的元素
        for (int i = 0; i < len; i++) {
            for (HashMapEntry e = tab[i]; e != null; e = e.next) {
                if (value.equals(e.value)) {
                    return true;
                }
            }
        }
        //最后判断空键值对的值是否是需要查找的值
        return entryForNullKey != null && value.equals(entryForNullKey.value);
}

7.2 集合的Size

Java

public int size() {
        return size;
}

Android

@Override public int size() {
        return size;
    }

7.3 集合是否为空

Java

public boolean isEmpty() {
        return size == 0;
}

Android

@Override public boolean isEmpty() {
        return size == 0;
}

7.4 清空

Java

循环变量数组将数组元素置为空,红黑树和链表等待JVM自动回收

public void clear() {
        Node<K,V>[] tab;
        modCount++;
        if ((tab = table) != null && size > 0) {
            size = 0;
            for (int i = 0; i < tab.length; ++i)
                tab[i] = null;
        }
}

Android

使用了工具类,将数组及相应链表内的数据全部填充为空

@Override 
public void clear() {
        if (size != 0) {
            Arrays.fill(table, null);
            entryForNullKey = null;
            modCount++;
            size = 0;
        }
}

八、遍历

8.1 键值对迭代器

Java

对应EntrySet的迭代器

//键值对Set
public Set<Map.Entry<K,V>> entrySet() {
        Set<Map.Entry<K,V>> es;
        return (es = entrySet) == null ? (entrySet = new EntrySet()) : es;
}
//键值对Set继承了抽象的Set
final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
        public final int size()                 { return size; }//返回HashMap的大小
        public final void clear()               { HashMap.this.clear(); }//清空数据
        public final Iterator<Map.Entry<K,V>> iterator() {//迭代器
            return new EntryIterator();
        }
        public final boolean contains(Object o) {//是否包含对象
            if (!(o instanceof Map.Entry))//判断是否是键值对类型
                return false;
            Map.Entry<?,?> e = (Map.Entry<?,?>) o;//转换为对应的键值对
            Object key = e.getKey();//获取Key
            Node<K,V> candidate = getNode(hash(key), key);//获取节点的键值对
            return candidate != null && candidate.equals(e);//判断节点是否相等
        }
        public final boolean remove(Object o) {//移除键值对
            if (o instanceof Map.Entry) {//如果是Map的键值对
                Map.Entry<?,?> e = (Map.Entry<?,?>) o;
                Object key = e.getKey();
                Object value = e.getValue();
                //找到键和值相等的键值对,并移除它
                return removeNode(hash(key), key, value, true, true) != null;
            }
            return false;
        }
        //拆分哈希表
        public final Spliterator<Map.Entry<K,V>> spliterator() {
            return new EntrySpliterator<>(HashMap.this, 0, -1, 0, 0);
        }
       public final void forEach(Consumer<? super Map.Entry<K,V>> action) {
            Node<K,V>[] tab;
            if (action == null)
                throw new NullPointerException();
            if (size > 0 && (tab = table) != null) {
                int mc = modCount;
                for (int i = 0; i < tab.length; ++i) {
                    for (Node<K,V> e = tab[i]; e != null; e = e.next)
                        action.accept(e);
                }
                if (modCount != mc)
                    throw new ConcurrentModificationException();
            }
        }
}
//Entry的键值对,继承了默认键值对
final class EntryIterator extends HashIterator
        implements Iterator<Map.Entry<K,V>> {
        public final Map.Entry<K,V> next() { return nextNode(); }
}

abstract class HashIterator {
        Node<K,V> next;        // next entry to return,下一个节点
        Node<K,V> current;     // current entry,当前节点,返回的节点
        int expectedModCount;  // for fast-fail,期望修改次数
        int index;             // current slot,当前的槽

        HashIterator() {
            expectedModCount = modCount;
            Node<K,V>[] t = table;
            current = next = null;
            index = 0;
            if (t != null && size > 0) { // advance to first entry
                do {} while (index < t.length && (next = t[index++]) == null);
            }
        }
        public final boolean hasNext() {//是否有下一个
            return next != null;//下一个不为空
        }
        final Node<K,V> nextNode() {//下一个节点
            Node<K,V>[] t;//
            Node<K,V> e = next;//下一个节点
            if (modCount != expectedModCount)//判断修改次数是否变化过
                throw new ConcurrentModificationException();
            if (e == null)//节点不为空,表示还有后续节点
                throw new NoSuchElementException();
            //如果next是null,就将next赋值为表中下一个不为null的值
            //如果next不是null,那么next就是链表或者红黑树中的下一个值
            if ((next = (current = e).next) == null && (t = table) != null) {
                do {} while (index < t.length && (next = t[index++]) == null);
            }
            return e;
        }
        //移除元素
        public final void remove() {
            Node<K,V> p = current;//当前节点
            if (p == null)//如果当前节点为空,抛出异常
                throw new IllegalStateException();
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            current = null;//将当前节点置为null,避免连续两次调用移除,并且不移动
            K key = p.key;//key值相等
            //移除node节点
            removeNode(hash(key), key, null, false, false);
            expectedModCount = modCount;
        }
}

Android

public Set<Entry<K, V>> entrySet() {
        Set<Entry<K, V>> es = entrySet;
        return (es != null) ? es : (entrySet = new EntrySet());
}
private final class EntrySet extends AbstractSet<Entry<K, V>> {
        public Iterator<Entry<K, V>> iterator() {
            return newEntryIterator();
        }
        public boolean contains(Object o) {
            if (!(o instanceof Entry))
                return false;
            Entry<?, ?> e = (Entry<?, ?>) o;
            return containsMapping(e.getKey(), e.getValue());
        }
        public boolean remove(Object o) {
            if (!(o instanceof Entry))
                return false;
            Entry<?, ?> e = (Entry<?, ?>)o;
            return removeMapping(e.getKey(), e.getValue());
        }
        public int size() {
            return size;
        }
        public boolean isEmpty() {
            return size == 0;
        }
        public void clear() {
            HashMap.this.clear();
        }
}
Iterator<Entry<K, V>> newEntryIterator() { return new EntryIterator(); }
private final class EntryIterator extends HashIterator
            implements Iterator<Entry<K, V>> {
        public Entry<K, V> next() { return nextEntry(); }
}
private abstract class HashIterator {
        int nextIndex;
        HashMapEntry<K, V> nextEntry = entryForNullKey;
        HashMapEntry<K, V> lastEntryReturned;
        int expectedModCount = modCount;

        HashIterator() {
            if (nextEntry == null) {
                HashMapEntry<K, V>[] tab = table;
                HashMapEntry<K, V> next = null;
                while (next == null && nextIndex < tab.length) {
                    next = tab[nextIndex++];
                }
                nextEntry = next;
            }
        }

        public boolean hasNext() {
            return nextEntry != null;
        }

        HashMapEntry<K, V> nextEntry() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            if (nextEntry == null)
                throw new NoSuchElementException();

            HashMapEntry<K, V> entryToReturn = nextEntry;
            HashMapEntry<K, V>[] tab = table;
            HashMapEntry<K, V> next = entryToReturn.next;
            while (next == null && nextIndex < tab.length) {
                next = tab[nextIndex++];
            }
            nextEntry = next;
            return lastEntryReturned = entryToReturn;
        }

        public void remove() {
            if (lastEntryReturned == null)
                throw new IllegalStateException();
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
            HashMap.this.remove(lastEntryReturned.key);
            lastEntryReturned = null;
            expectedModCount = modCount;
        }
}

8.2 Key迭代器

Java

public Set<K> keySet() {
        Set<K> ks;
        return (ks = keySet) == null ? (keySet = new KeySet()) : ks;
}
//与EntrySet相同,只不过处理的Entry
final class KeySet extends AbstractSet<K> {
        public final int size()                 { return size; }
        public final void clear()               { HashMap.this.clear(); }
        public final Iterator<K> iterator()     { return new KeyIterator(); }
        public final boolean contains(Object o) { return containsKey(o); }
        public final boolean remove(Object key) {
            return removeNode(hash(key), key, null, false, true) != null;
        }
        public final Spliterator<K> spliterator() {
            return new KeySpliterator<>(HashMap.this, 0, -1, 0, 0);
        }
        public final void forEach(Consumer<? super K> action) {
            Node<K,V>[] tab;
            if (action == null)
                throw new NullPointerException();
            if (size > 0 && (tab = table) != null) {
                int mc = modCount;
                for (int i = 0; i < tab.length; ++i) {
                    for (Node<K,V> e = tab[i]; e != null; e = e.next)
                        action.accept(e.key);
                }
                if (modCount != mc)
                    throw new ConcurrentModificationException();
            }
        }
}
final class KeyIterator extends HashIterator
        implements Iterator<K> {
        public final K next() { return nextNode().key; }
}

Android

@Override
public Set<K> keySet() {
        Set<K> ks = keySet;
        return (ks != null) ? ks : (keySet = new KeySet());
}
private final class KeySet extends AbstractSet<K> {
        public Iterator<K> iterator() {
            return newKeyIterator();
        }
        public int size() {
            return size;
        }
        public boolean isEmpty() {
            return size == 0;
        }
        public boolean contains(Object o) {
            return containsKey(o);
        }
        public boolean remove(Object o) {
            int oldSize = size;
            HashMap.this.remove(o);
            return size != oldSize;
        }
        public void clear() {
            HashMap.this.clear();
        }
}
Iterator<K> newKeyIterator() { return new KeyIterator();   }

private final class KeyIterator extends HashIterator
            implements Iterator<K> {
        public K next() { return nextEntry().key; }
}

8.3 值迭代器

Java

public Collection<V> values() {
        Collection<V> vs;
        return (vs = values) == null ? (values = new Values()) : vs;
}
final class Values extends AbstractCollection<V> {
        public final int size()                 { return size; }
        public final void clear()               { HashMap.this.clear(); }
        public final Iterator<V> iterator()     { return new ValueIterator(); }
        public final boolean contains(Object o) { return containsValue(o); }
        public final Spliterator<V> spliterator() {
            return new ValueSpliterator<>(HashMap.this, 0, -1, 0, 0);
        }
        public final void forEach(Consumer<? super V> action) {
            Node<K,V>[] tab;
            if (action == null)
                throw new NullPointerException();
            if (size > 0 && (tab = table) != null) {
                int mc = modCount;
                for (int i = 0; i < tab.length; ++i) {
                    for (Node<K,V> e = tab[i]; e != null; e = e.next)
                        action.accept(e.value);
                }
                if (modCount != mc)
                    throw new ConcurrentModificationException();
            }
        }
}
final class ValueIterator extends HashIterator
        implements Iterator<V> {
        public final V next() { return nextNode().value; }
}

Android

@Override public Collection<V> values() {
        Collection<V> vs = values;
        return (vs != null) ? vs : (values = new Values());
}
private final class Values extends AbstractCollection<V> {
        public Iterator<V> iterator() {
            return newValueIterator();
        }
        public int size() {
            return size;
        }
        public boolean isEmpty() {
            return size == 0;
        }
        public boolean contains(Object o) {
            return containsValue(o);
        }
        public void clear() {
            HashMap.this.clear();
        }
}
Iterator<V> newValueIterator() { return new ValueIterator(); }
private final class ValueIterator extends HashIterator
            implements Iterator<V> {
        public V next() { return nextEntry().value; }
}

8.4 小结

  1. 三个迭代器都是一个迭代器的子类
  2. 如果遍历Map的话,建议使用EntrySet,这个效率稍高,不用再次调用get方法获取Value值
  3. Java和Android大同小异,除了Java多了一种数据结构红黑树

九、总结

  1. 关于底层数据结构:哈希桶(每个桶里放置链表或红黑树)
  2. 关于容量和负载因子:容量是哈希表的最大容量,负载因子是哈希Map的存储比例
    阈值是最大容量*负载因子。而判断是否超过阈是采用size进行判断,并不是hashTable中数组的占有比例
  3. 影响哈希Map的效率最主要的方法是key对应类实现的hashCode。
  4. 可以设置key值为null和value值为null
  5. 与HashTable的区别
    4.1. HashMap是线程非安全的,HashTable是线程安全的,Hashtable不允许key和value值为null,
    4.2. 关于Hash值,HashMap中使用了一个函数来处理key.hashCode()方法,Hashtable直接使用了key.hashCode()方法作为hash值,这样也是为什么key值不能为null,表的位置信息是采用模运算,因为表的长度不是2的n次方。
    4.3. Hashtable扩容是2倍+1,表的长度最小可以设为1。如果使用默认构造函数,那么长度是11,可以理解为默认长度是11.

参考

  1. 散列表(哈希表)的定义
  2. 红黑树
  3. Java HashMap工作原理及实现

其他文章

容器解析
ArrayList解析
LinkedList解析
TreeMap解析(上)
TreeMap解析(下)
HashMap解析
LinkedHasMap解析(下)
Set解析

上一篇下一篇

猜你喜欢

热点阅读