腾讯一面对 ArrayList 集合的面试问题，带你通过“源码”

2021-07-21 本文已影响0人废柴程序员

前言

ArrayList 是开发中使用最频繁的集合框架中的数据结构之一了，而且也是面试中必问考题。所以很有必要掌握，熟练使用。所以，我们将从源码分析底层原理实现和面试中常用考点分析。

ArrayList 简介

ArrayList 是 Java 集合框架中的成员之一，底层是基于数组实现，并且集合容量可动态变化的。它继承自 AbstractList 抽象类，实现了 List 接口。同时还实现了 RandomAccess，Cloneable 和 Serializable 三个标记接口，说明 ArrayList 是支持快速随机访问，可克隆复制的，可序列化的。

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
}

腾讯一面对 ArrayList 集合的面试问题，带你通过源码分析这些问题

3 ArrayList 源码分析

3.1 变量

ArrayList 底层是基于数组实现，并且集合容量可动态变化。类中定义了一个 Object 类型的数组存储元素，因为是 Object 类型的数组，所以也只能存储引用数据类型，如果存储基本数据类型（例如 int ，double等），底层会自动将基本数据类型进行类的包装。

ArrayList 中还定义了一个记录数组元素个数的变量，以及一个代表默认初始化容量的静态变量。

/**
 * ArrayList 中存储元素的数组，数组的长度即集合的容量
 * 不用 private 关键字修饰是为了内部类方便访问此数组
 * transient 关键字修饰代表此数组不作为序列化的一部分
 */
transient Object[] elementData;
/**
 * 记录 ArrayList 集合中实际存储的元素个数
 */
private int size;
/**
 * 默认初始化容量
 */
private static final int DEFAULT_CAPACITY = 10;

ArrayList 中定义了两个静态空数组对象，主要用来当集合初始化，并且没有添加任何元素时，作为一个空数组对象赋值给 elementData 数组对象，代表一个空 list。那为啥要定义2个空数组对象呢？后面会细讲。

/**
 * 一个共享的静态空数组对象，用于空 list 集合中
 */
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
 * 一个共享的静态空数组对象，用于默认大小初始化的空 list 集合中
 */
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

ArrayList 的父类 AbstractList 中定义了 modCount 变量，它记录了集合被操作修改的次数，在使用迭代器 Iterator 中会被使用到，因为在使用迭代器遍历集合元素的过程中集合结构不允许被修改（例如添加元素，删除元素），通过比较 modCount 的值能防止在迭代的过程中集合被修改。

protected transient int modCount = 0;

3.2 构造函数

ArrayList 有三个构造函数，一个无参构造函数，一个指定集合容量大小的有参构造函数，以及一个使用指定 Collection 集合来构造集合的构造函数。

无参构造函数，即初始化一个容量为10的空 list 集合，虽说是初始化容量为10的集合，但是实际此时没创建一个容量为10的数组，而只是将
DEFAULTCAPACITY_EMPTY_ELEMENTDATA 这个空数组对象赋值给 elementData 变量，只有在第一次添加元素时才创建一个容量的为10的数组。

/**
 * 构造一个容量为10的空 list
 */
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

指定初始化容量的有参构造函数，当初始化容量大于0时，直接创建指定容量大小的数组，如果初始化容量为0，则将 EMPTY_ELEMENTDATA 空数组对象赋值给 elementData 变量。

/**
 * 构造一个指定初始化容量大小的空 list
 */
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

使用指定 Collection 集合来构造 ArrayList 对象，如果 Collection 不为空，则将其元素拷贝赋值到 elementData 中，如果 Collection 为空，则还是创建一个空的 list，相当于 new ArrayList(0)。

/**
 * 构造一个 list，它包含了指定 Collection 集合元素，这些元素的顺序是通过集合迭代器返回元素的顺序决定的
 */
public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

3.3 常用方法

public boolean add(E e)

在 list 尾部添加一个元素，首先会将记录对集合操作的次数加1，然后再判断集合容量是否足够，不够则进行扩容。

/**
 * 在 list 尾部添加一个元素
 */
public boolean add(E e) {
    // 修改操作次数，并且是否进行扩容操作
    ensureCapacityInternal(size + 1);
    // 将新元素添加在数组尾部
    elementData[size++] = e;
    return true;
}
private void ensureCapacityInternal(int minCapacity) {
    // 如果是采用默认初始化容量10构造的 list，则取默认初始化容量10和当前需要添加元素的下标+1的最大值来初始化 list
    // 这里就说明了为什么要定义2个空数组对象，因为通过判断空 list 是否等于 DEFAULTCAPACITY_EMPTY_ELEMENTDATA，
    // 如果是，则使用默认的初始化容量10来进行扩容
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
    // 修改次数加1
    modCount++;
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        // 扩容
        grow(minCapacity);
}
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    // 扩容到原来容量的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 最大容量为 Integer.MAX_VALUE
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 拷贝数组
    elementData = Arrays.copyOf(elementData, newCapacity);
}

public void add(int index, E element)

在 list 指定下标位置添加一个元素，首先会检查下标是否在范围内，将记录对集合操作的次数加1，然后再判断集合容量是否足够，不够则进行扩容。

public void add(int index, E element) {
    rangeCheckForAdd(index);
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    // 将下标位置后面的所有元素往后拷贝移一位
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}
private void rangeCheckForAdd(int index) {
    if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

public E set(int index, E element)

修改 list 指定下标位置的元素，首先会检查下标是否在范围内，然后替换指定下标的元素，返回旧的元素。

/**
 * Replaces the element at the specified position in this list with
 * the specified element.
 *
 * @param index index of the element to replace
 * @param element element to be stored at the specified position
 * @return the element previously at the specified position
 * @throws IndexOutOfBoundsException {@inheritDoc}
 */
public E set(int index, E element) {
    rangeCheck(index);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}
private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

public boolean addAll(Collection<? extends E> c)

将指定 Collection 的所有元素添加到 list 的尾部中去，还是先检查是否需要扩容，最后再将 Collection 集合拷贝到 list 尾部。

public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
    return numNew != 0;
}

public int size()

返回集合中元素的个数

public int size() {
    return size;
}

public boolean isEmpty()

判断集合是否为空，即集合是否有元素

/**
 * Returns <tt>true</tt> if this list contains no elements.
 *
 * @return <tt>true</tt> if this list contains no elements
 */
public boolean isEmpty() {
    return size == 0;
}

public boolean contains(Object o)

判断集合是否包含某元素，主要通过 equals 方法比较是否存在某元素。

public boolean contains(Object o) {
    return indexOf(o) >= 0;
}
public int indexOf(Object o) {
    if (o == null) {
        for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

public E get(int index)

返回指定下标位置的元素，访问速度快。

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}
E elementData(int index) {
    return (E) elementData[index];
}

public Iterator iterator()

获取 list 的迭代器，用于遍历集合中的元素。

public Iterator<E> iterator() {
    return new Itr();
}

4 常见面试题分析

4.1 ArrayList 是线程安全的吗？

我们通过分析 ArrayList 源码可知，对它的任何操作都是没有加锁的，所以在多线程场景下，它是线程不安全的。如果在非多线程使用场景下，我们还是使用很频繁，因为主要用来存储数据，查询比较多，增删操作比较少。

如果增删操作比较多的话，可以使用 LinkedList，LinkedList 增删操作速度比较快。（以后我们再详细介绍 LinkedList ）。

如果需要线程安全的话，可以推荐使用 Vector 集合，分析 Vector 源码会发现好多方法加了 synchronized 关键字修饰，即同一时间只允许一个线程进行操作，所以效率比较低，但是 Vector 是线程安全的。不过JDK集合中的工具类 Collections 提供一个方法 synchronizedList 可以将线程不安全的 ArrayList 集合变成线程安全的集合对象，所以 Vector 慢慢地也很少人使用了。

public static void main(String[] args) {

  ArrayList<String> arrayList = new ArrayList<>();
  arrayList.add("Java");
  arrayList.add("C++");
  // 封装成线程安全的集合
  List<String> list = Collections.synchronizedList(arrayList);

}

4.2 ArrayList 优缺点

优点：查询速度快，因为底层是基于数组实现，数组在内存中是一块联系的内容空间，所以根据地址和索引的方式可以快速随机访问集合中的元素。
缺点：增删慢，每次添加和删除元素，都有可能涉及到数组长度的改变和元素的拷贝移动，特别是数组元素很多时比较耗时。线程不安全。

4.3 ArrayList 底层是数组实现的，那为什么不直接使用数组？

ArrayList 底层虽然是通过数组实现的，但是它内部对数组进行了封装，能支持自动动态扩容，而直接使用数组的话，如果想要实现动态扩容效果，需要开发人员自己去处理扩容机制，容易出错。而且 ArrayList 内部封装了许多方法（例如在指定位置添加元素，删除指定下标的元素，遍历集合等）方便开发人员操作集合，减少开发成本。

4.4 JDK 1.7 前后有什么变化？

在 JDK 1.7之前，ArrayList 初始化的时候，会直接调⽤ this(10) 达到真正初始化创建数组，而在 JDK 1.7以及之后只是将静态空数组赋值给 elementData，并没有真正初始化容量10，等到第一次添加元素时容量才变化为10。

再者，之前容量扩容的时候，是扩容到原来容量的1.5倍+1，而且之后是采用位操作扩容1.5倍，扩容速度更快。

// 1.7之前
int newCapacity = (oldCapacity * 3)/2 + 1;
// 1.7之后
int newCapacity = oldCapacity + (oldCapacity >> 1);

4.5 初始化 ArrayList 后，直接调用 set方法会怎么样？

通过源码分析，通过构造方法初始化 ArrayList 之后（new ArrayList(Collection<? extends E> c) 除外），不管是默认的初始化还是指定容量大小的初始化，它们底层的 size 值都是为0，但是调用 set(int index, E element) 方法，它首先会检查下标是否大于等于 size 值，如果是会报错。所以初始化后的 ArrayList 对象，不能马上直接调用 set 方法，会报错。

// 初始化后，此时 size 的值还是为0
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}
public E set(int index, E element) {
    rangeCheck(index);
    E oldValue = elementData(index);
    elementData[index] = element;
    return oldValue;
}
private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

[图片上传失败...(image-7571a5-1626854861117)]

4.6 ArrayList 增删为什么会慢？

通过源码分析，对 ArrayList 集合的添加元素和删除元素，会涉及到数组的扩容和数据拷贝，如果数组元素个数巨大的话，会减低速度。但是如果是在尾部插入删除的话，如果在不超出数组原有长度的话，就不会涉及数组的扩容和数据拷贝，所以这时执行速度还是很快的。

所以我们要结合实际场景选择合适的数据结构，业务场景到底是增删多，还是查询多，增删多我们可以选择 LinkedList ，如果是查询多可以选择 ArrayList 。

4.7 使用迭代器 Iterator 过程中，可以增删元素吗？

通过源码分析，在获取集合的迭代器方法中，实际是返回了 Iterator 接口的实现类 Itr。而且 Itr 是 ArrayList 类中的一个内部类。

public Iterator<E> iterator() {
    return new Itr();
}

查看内部类 Itr ，定义了三个变量，cursor 变量指示下一个需要返回元素的下标；lastRet 变量指示当前需要返回元素的下标，-1代表不返回；expectedModCount 变量在 new Itr () 时被赋值 ArrayList 集合中 modCount 变量此时的值。

在获取下一个元素的方法 next() 中，会先 checkForComodification() 方法，它的作用是检查当前 expectedModCount 的值是否等于 ArrayList 对象目前 modCount 的值，如果不相等会报错，这也就是为什么在使用迭代器的过程中，不允许对 ArrayList 对象的做增删操作。

private class Itr implements Iterator<E> {
     int cursor;       // index of next element to return
     int lastRet = -1; // index of last element returned; -1 if no such
     int expectedModCount = modCount;
     public boolean hasNext() {
         return cursor != size;
     }
     @SuppressWarnings("unchecked")
     public E next() {
         checkForComodification();
         int i = cursor;
         if (i >= size)
             throw new NoSuchElementException();
         Object[] elementData = ArrayList.this.elementData;
         if (i >= elementData.length)
             throw new ConcurrentModificationException();
         cursor = i + 1;
         return (E) elementData[lastRet = i];
     }
     public void remove() {
         if (lastRet < 0)
             throw new IllegalStateException();
         checkForComodification();
         try {
             ArrayList.this.remove(lastRet);
             cursor = lastRet;
             lastRet = -1;
             expectedModCount = modCount;
         } catch (IndexOutOfBoundsException ex) {
             throw new ConcurrentModificationException();
         }
     }

    final void checkForComodification() {
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
    }
}

4.8 Arrays.asList 创建 ArrayList 的使用问题

Arrays.asList() 方法生成的 ArrayList 类对象，在调用 add，remove等方法时会报错。

public static void main(String[] args) {
  List<String> list = Arrays.asList("Java", "C++", "Python");
  list.add("C#"); // 这行会报错
}

通过源码分析，Arrays.asList() 生成的 ArrayList 对象不是我们本文所讲的 java.util.ArrayList，Arrays 中的内部类 ArrayList 继承了 AbstractList 类，但是它没有重写 AbstractList 类的 add 和 remove 等法，所以直接调用这些方法时会调用它父类 AbstractList 的同名方法，而 AbstractList 类中这些方法是没有具体的实现操作的，而是简单地抛出了异常。

public class Arrays {
    public static <T> List<T> asList(T... a) {
        return new ArrayList<>(a);
    }
    /**
     * @serial include
     */
    private static class ArrayList<E> extends AbstractList<E>
        implements RandomAccess, java.io.Serializable {
        private static final long serialVersionUID = -2764017481108945198L;
        private final E[] a;
        ArrayList(E[] array) {
            a = Objects.requireNonNull(array);
        }
        // 省略一些代码
    }
    // 省略一些代码
}

AbstractList 类中方法的定义如下：

public void add(int index, E element) {
    throw new UnsupportedOperationException();
}
/**
 * {@inheritDoc}
 *
 * <p>This implementation always throws an
 * {@code UnsupportedOperationException}.
 *
 * @throws UnsupportedOperationException {@inheritDoc}
 * @throws IndexOutOfBoundsException     {@inheritDoc}
 */
public E remove(int index) {
    throw new UnsupportedOperationException();
}

4.9 ArrayList 可以存储null值吗？元素可以重复吗？

ArrayList 底层是数组实现的，并且在添加元素的时候。没有对元素进行值校验，而是直接赋值到数组中，所以 ArrayList 是可以存储 null 值，并且存储的元素是可以重复的。

/**
 * 在 list 尾部添加一个元素
 */
public boolean add(E e) {
    // 修改操作次数，并且是否进行扩容操作
    ensureCapacityInternal(size + 1);
    // 将新元素添加在数组尾部
    elementData[size++] = e;
    return true;
}

4.10 如何边遍历 ArrayList 元素，边删除指定元素？

可能有人会使用下面的方式来实现边遍历 ArrayList 元素，边删除指定元素：

[图片上传失败...(image-2529ad-1626854861112)]

你会发现执行报错了，
ConcurrentModificationException 并发修改异常，前面我们提到使用迭代器 Iterator 遍历集合时，不能对集合进行增删操作（会导致 modCount 值变化），而增强 for 循环底层也是使用迭代器实现的，所以会报错。应该使用 Iterator 类的 remove 方法。

腾讯一面对 ArrayList 集合的面试问题，带你通过源码分析这些问题

5 总结

关于 ArrayList 集合类的相关知识先介绍到这，也建议大家自己翻阅下源码，然后写几个demo调试下，这样才能更加深对它的了解。大家也可以在下方评论你遇到过的 ArrayList 面试题，我来给你解答或者一起探讨。