arraylist源码分析

2018-02-16  本文已影响0人  铁甲依然在_978f

1、前言
说到ArrayList,就不得不说Array。光看名字,还以为这2个是同一个东西。其实不然。
Array:指容量为固定的数组,常见的初始化方法如下:

String[] names = {"david","tom","kate"};

在声明的时候直接声明了内部元素,这样jvm就可以快速的分配给指定大小的空间。同时,看Array源码可知,Array的方法基本上都是native方法,其底层实现均为c/c++实现。

ArrayList:动态数组,允许新增、删除等操作,常见的初始化方法:

List<String> nameList = new ArrayList<>();

看完概念,我们开始正题,开始源码的解读。

2、与其他容器对比

与hashmap不同,ArrayList为集合的一种,来源自数据结构中的数组概念,与hashmap源自数据结构中的图概念不同。

我们先看ArrayList的uml图。

image

可以看出,ArrayList不仅实现了Cloneable、Serializable接口,还 实现了RandomAccess接口、List接口。

3、简述RandomAccess接口
在后续代码中,还可以看到RandomAccess这个接口。若实现了该接口,则表明该类可以进行下标式访问,类似于这样:

List<String> nameList = new ArrayList<>();
String david  = names[0];

(这个会提示越界了)

4、成员变量分析
ArrayList的成员变量分析如下:

//默认容量
private static final int DEFAULT_CAPACITY = 10;
//空数组
private static final Object[] EMPTY_ELEMENTDATA = {};
//也是空数组,作用是在新增元素的时候用
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//数组
transient Object[] elementData;
//数组大小
private int size;
//数组最大容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
//继承自AbstractList,用于fail-fast机制
protected transient int modCount = 0;

从成员变量来看,数组用transient修饰符修饰,作用应该是类似于hashmap的Node[]。

5、核心方法分析

5.1 容量扩增

private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        //新空间分配直接扩大50%
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //得出较大的值
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        //元素复制
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

private static int hugeCapacity(int minCapacity) {
        //这一点比较特殊,见下面分析
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

关于hugeCapacity的判断小于0则为溢出,由于在jvm内部是以反码存储的数据,首位为符号位,当容量扩增后,若溢出,首位则变为1,此时变为负数,则可以快速判断出是否溢出。

5.2 trimToSize 压缩空间

去掉多余的空对象,精简存储空间

public void trimToSize() {
        modCount++;
        //代码也写的很简洁,经常使用三元表达式
        if (size < elementData.length) {
            elementData = (size == 0)
              ? EMPTY_ELEMENTDATA
              : Arrays.copyOf(elementData, size);
        }
    }

由上面的扩增容量可知,如果原始容量是100,在扩增容量后,那么分配的容量为150.但是实际上可能只存110个对象实例,那么此时调用这个方法,就可以节约一定的存储空间。不过若数组较大,那么操作可能会耗费一点时间。

5.3 fail-fast机制
这个其实在hashmap中也采取了类似机制,就是额外有一个成员变量,用于快速判断该实例是否有变化,若在进行迭代的时候有变更,那么就抛出一个并发修改异常(ConcurrentModificationException)。

5.4 indexOf 求 下标

public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
}

这段代码略过,用的比较多,没什么亮点。

5.5 新增一个元素

既然是数组,那么就有两种 新增的方式:指定特定的位置、向后插入。

向指定位置写入元素:

public void add(int index, E element) {
        //下标检查,是否越界了
        rangeCheckForAdd(index);
        //扩增容量,同时改变modcount
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //index后面的元素后移
        System.arraycopy(elementData, index, elementData, index + 1, size - index);
        //指定位置放置元素
        elementData[index] = element;
        //元素数量大小自增
        size++;
    }

向后插入一个元素:

public boolean add(E e) {
        //扩大容量,修改modcount
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //注意
        //数组是从0开始的存元素的,而数组个数是从1开始计数的
        //这个地方是往第size个位置上存元素
        //再将元素个数加1
        elementData[size++] = e;
        return true;
    }

从以上源码可以看出,向后插入一个元素不用进行元素的复制,自然效率要大于指定位置插入一个元素。

5.6 移除一个元素
同新增,也是分2种。
移除指定位置的元素:

public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            //元素迁移
            System.arraycopy(elementData, index+1, elementData, index, numMoved);
        //这个与新增类似,但是是左自减运算,自己体会吧
        //特地表明将该位置的置空,让gc回收空间
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

删除指定元素:

public boolean remove(Object o) {
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

//类似指定位置删除元素
private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

看到这个指定删除某个元素的代码,那么有人就会有疑问了,如果我里面有多个一样的元素,那这不是删不完吗?这个时候你得使用removeAll:

public boolean removeAll(Collection<?> c) {
    //参数校验,仅判断c != null,感觉不太严谨
    Objects.requireNonNull(c);
    return batchRemove(c, false);
}

private boolean batchRemove(Collection<?> c, boolean complement) {
    //常量数组,不允许再赋值,但是数组内部的元素允许自由移动、被重新赋值
    final Object[] elementData = this.elementData;
    int r = 0, w = 0;
    boolean modified = false;
    try {
        for (; r < size; r++)
            //不包含该元素,则存到新数组,其实是位置前移
            if (c.contains(elementData[r]) == complement)
                elementData[w++] = elementData[r];
    } finally {
        // Preserve behavioral compatibility with AbstractCollection,
        // even if c.contains() throws.
        //上面if内类型不匹配抛异常时,r与size不等
        if (r != size) {
            System.arraycopy(elementData, r,
                             elementData, w,
                             size - r);
            w += size - r;
        }
        if (w != size) {
            // clear to let GC do its work
            //由于将已包含的元素前移了,那么不包含的元素都在后面,直接将后面的元素删掉
            for (int i = w; i < size; i++)
                elementData[i] = null;
            modCount += size - w;
            size = w;
            modified = true;
        }
    }
    return modified;
}

5.7 序列化
这个源码类似于hashmap,就不重复分析了。

5.8 其他
set、get方法比较简单, 就不分析了。
需要注意的是,arraylist继承的AbstractList覆写了hashcode和equals方法。

6 小结
总的来说,arraylist的源码比较简单,可供分析的内容不多。

上一篇下一篇

猜你喜欢

热点阅读