Java集合

Java 容器 --- List(ArrayList、Linke

2021-06-01  本文已影响0人  _code_x

在一开始基础面的时候,很多面试官可能会问List集合一些基础知识,比如:


ArrayList(1.8)

ArrayList是由动态再分配的Object[]数组作为底层结构,可设置null值,是非线程安全的。

ArrayList成员属性

//默认空的数组,在构造方法初始化一个空数组的时候使用
private static final Object[] EMPTY_ELEMENTDATA = {};

//使用默认size大小的空数组实例
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

//ArrayList底层存储数据就是通过数组的形式,ArrayList长度就是数组的长度。
transient Object[] elementData; 

//ArrayList的大小
private int size;

那么 ArrayList 底层数据结构是什么呢?

为什么 ArrayList 的 elementData 加上 transient 修饰(序列化)?

ArrayList的构造方法

//带有初始化容量的构造方法
public ArrayList(int initialCapacity) {
    //参数大于0,elementData初始化为initialCapacity大小的数组
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    //参数等于0,elementData初始化为空数组
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    //参数小于0,抛出异常
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

//无参构造方法
public ArrayList() {
    //在1.7以后的版本,构造方法中将elementData初始化为空数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA
    //当调用add方法添加第一个元素的时候,会进行扩容,扩容至大小为DEFAULT_CAPACITY=10
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

那么ArrayList默认大小是多少?

ArrayList的Add方法

boolean add(E)
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}
private void ensureCapacityInternal(int minCapacity) {
    //判断当前的数组是否为默认设置的空数据,是否取出最小容量
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    //包括扩容机制grow方法
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    //记录着集合的修改次数,也就每次add或者remove它的值都会加1
    modCount++;

    //当前容量容纳不下数据时(下标超过时),ArrayList扩容机制:扩容原来的1.5倍
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    //ArrayList扩容机制:扩容原来的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

ArrayList是如何扩容的?

//相当于int newCapacity = oldCapacity + oldCapacity/2
int newCapacity = oldCapacity + (oldCapacity >> 1);
void add(int,E)
public void add(int index, E element) {
    //检查index也就是插入的位置是否合理,是否存在数组越界
    rangeCheckForAdd(index);
    //机制和boolean add(E)方法一样
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}

ArrayList的删除方法

remove(int)
public E remove(int index) {
    //检查下标是否超出数组长度,造成数组越界
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);
    //算出数组需要移动的元素数量
    int numMoved = size - index - 1;
    if (numMoved > 0)
        //数组数据迁移,这样会导致删除数据时,效率会慢
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    //将--size上的位置赋值为null,让gc(垃圾回收机制)更快的回收它。
    elementData[--size] = null; // clear to let GC do its work
    //返回删除的元素
    return oldValue;
}

为什么说ArrayList删除元素效率低?

remove(Object)
public boolean remove(Object o) {
    //如果需要删除数据为null时,会让数据重新排序,将null数据迁移到数组尾端
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                //删除数据,并迁移数据
                fastRemove(index);
                return true;
            }
    } else {
        //循环删除数组中object对象的值,也需要数据迁移
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

可以看出,arrayList是可以存放null值。


LinkedList(1.8)

LinkedList是一个继承于AbstractSequentialList的双向链表。它也可以被当做堆栈、队列或双端队列进行使用,而且LinkedList也为非线程安全, jdk1.6使用的是一个带有 header节头结点的双向循环链表, 头结点不存储实际数据 ,在1.6之后,就变更使用两个节点firstlast指向首尾节点。

LinkedList的主要属性

//链表节点的个数 
transient int size = 0; 
//链表首节点
 transient Node<E> first; 
//链表尾节点
 transient Node<E> last; 
//Node节点内部类定义
private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

注意:一旦变量被transient修饰,该变量不会被序列化,即变量将不再是对象持久化的一部分。

LinkedList构造方法

无参构造函数, 默认构造方法声明也不做,firstlast节点会被默认初始化为null。

/** Constructs an empty list. **/

public LinkedList() {}

LinkedList插入

由于LinkedList由双向链表作为底层数据结构,因此其插入无非三种情况:

可以从源码看出,在链表首尾添加元素很高效,在中间添加元素比较低效,首先要找到插入位置的节点,在修改前后节点的指针。

尾插-add(E e)和addLast(E e)
//常用的添加元素方法
public boolean add(E e) {
    //使用尾插法
    linkLast(e);
    return true;
}

//在链表尾部添加元素
public void addLast(E e) {
    linkLast(e);
}

//在链表尾端添加元素
void linkLast(E e) {
    //尾节点
    final Node<E> l = last;
    final Node<E> newNode = new Node<>(l, e, null);
    last = newNode;
    //判断是否是第一个添加的元素
    //如果是将新节点赋值给last
    //如果不是把原首节点的prev设置为新节点
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    //将集合修改次数加1
    modCount++;
}
头插-addFirst(E e)
public void addFirst(E e) {
    //在链表头插入指定元素
    linkFirst(e);
}

private void linkFirst(E e) {
     //获取头部元素,首节点
    final Node<E> f = first;
    final Node<E> newNode = new Node<>(null, e, f);
    first = newNode;
    //链表头部为空,(也就是链表为空)
    //插入元素为首节点元素
    //否则就更新原来的头元素的prev为新元素的地址引用
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    // 将集合的修改次数+1
    size++;
    modCount++;
}
中插-add(int index, E element)

index不为首尾的的时候,实际就在链表中间插入元素。

// 作用:在指定位置添加元素
public void add(int index, E element) {
    // 检查插入位置的索引的合理性
    checkPositionIndex(index);

    if (index == size)
        // 插入的情况是尾部插入的情况:调用linkLast()。
        linkLast(element);
    else
        // 插入的情况是非尾部插入的情况(中间插入):linkBefore
        linkBefore(element, node(index));
}

private void checkPositionIndex(int index) {
    if (!isPositionIndex(index))
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

private boolean isPositionIndex(int index) {
    return index >= 0 && index <= size;
}

void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    // 得到插入位置元素的前继节点
    final Node<E> pred = succ.prev;  
    // 创建新节点,其前继节点是succ的前节点,后接点是succ节点
    final Node<E> newNode = new Node<>(pred, e, succ);  
    // 更新插入位置(succ)的前置节点为新节点
    succ.prev = newNode;  
    if (pred == null)
        // 如果pred为null,说明该节点插入在头节点之前,要重置first头节点 
        first = newNode;
    else
        // 如果pred不为null,那么直接将pred的后继指针指向newNode即可
        pred.next = newNode;
    size++;
    modCount++;
}

LinkedList 删除

删除和插入一样,其实本质也是只有三种情况:

在首尾节点删除很高效,删除中间元素比较低效要先找到节点位置,再修改前后指针指引。

删除中间节点-remove(int index)和remove(Object o)

remove(int index)remove(Object o)都是使用删除指定节点的unlink删除元素

 public boolean remove(Object o) {
     //因为LinkedList允许存在null,所以需要进行null判断        
     if (o == null) {
         //从首节点开始遍历
         for (Node<E> x = first; x != null; x = x.next) {
             if (x.item == null) {
                 //调用unlink方法删除指定节点
                 unlink(x);
                 return true;
             }
         }
     } else {
         for (Node<E> x = first; x != null; x = x.next) {
             if (o.equals(x.item)) {
                 unlink(x);
                 return true;
             }
         }
     }
    return false;
 } 

//删除指定位置的节点,其实和上面的方法差不多
//通过node方法获得指定位置的节点,再通过unlink方法删除
public E remove(int index) {
    checkElementIndex(index);

    return unlink(node(index));
}

//删除指定节点
E unlink(Node<E> x) {
    //获取x节点的元素,以及它上一个节点,和下一个节点
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;
    //如果x的上一个节点为null,说明是首节点,将x的下一个节点设置为新的首节点
    //否则将x的上一节点设置为next,将x的上一节点设为null
    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }
    //如果x的下一节点为null,说明是尾节点,将x的上一节点设置新的尾节点
    //否则将x的上一节点设置x的上一节点,将x的下一节点设为null
    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }
    //将x节点的元素值设为null,等待垃圾收集器收集
    x.item = null;
    //链表节点个数减1
    size--;
    //将集合修改次数加1
    modCount++;
    //返回删除节点的元素值
    return element;
}
删除首节点-removeFirst()
//删除首节点
public E remove() {
    return removeFirst();
}
//删除首节点
public E removeFirst() {
  final Node<E> f = first;
  //如果首节点为null,说明是空链表,抛出异常
  if (f == null)
      throw new NoSuchElementException();
  return unlinkFirst(f);
}
//删除首节点
private E unlinkFirst(Node<E> f) {
  //首节点的元素值
  final E element = f.item;
  //首节点的下一节点
  final Node<E> next = f.next;
  //将首节点的元素值和下一节点设为null,等待垃圾收集器收集
  f.item = null;
  f.next = null; // help GC
  //将next设置为新的首节点
  first = next;
  //如果next为null,说明说明链表中只有一个节点,把last也设为null
  //否则把next的上一节点设为null
  if (next == null)
      last = null;
  else
      next.prev = null;
  //链表节点个数减1
  size--;
  //将集合修改次数加1
  modCount++;
  //返回删除节点的元素值
  return element;
}
删除尾节点-removeLast()
//删除尾节点
public E removeLast() {
    final Node<E> l = last;
    //如果首节点为null,说明是空链表,抛出异常
    if (l == null)
        throw new NoSuchElementException();
    return unlinkLast(l);
}
private E unlinkLast(Node<E> l) {
    //尾节点的元素值
    final E element = l.item;
    //尾节点的上一节点
    final Node<E> prev = l.prev;
    //将尾节点的元素值和上一节点设为null,等待垃圾收集器收集
    l.item = null;
    l.prev = null; // help GC
    //将prev设置新的尾节点
    last = prev;
    //如果prev为null,说明说明链表中只有一个节点,把first也设为null
    //否则把prev的下一节点设为null
    if (prev == null)
        first = null;
    else
        prev.next = null;
    //链表节点个数减1
    size--;
    //将集合修改次数加1
    modCount++;
    //返回删除节点的元素值
    return element;
}

其他方法也是类似的,比如查询方法 LinkedList提供了getgetFirstgetLast等方法获取节点元素值。

modCount属性的作用?

这是jdk在面对迭代遍历的时候为了避免不确定性而采取的 fail-fast(快速失败)原则:


总结与补充

ArrayList和LinkedList的区别、优缺点以及应用场景

区别:

优缺点:

应用场景:

ArrayList使用在查询比较多,但是插入和删除比较少的情况,而LinkedList用在查询比较少而插入删除比较多的情况

list 的遍历方式和RandomAccess接口

RandomAccess接口只是标识,并不是说 ArrayList实现RandomAccess 接口才具有快速随机访问功能的。下面再总结⼀下 list 的遍历方式选择:

list三种遍历方式:

//1、方法一:for循环
List<Product> list = new ArayList<Product>();
for(int i=0 ; i< list.size();i++){
   System.out.println(list.get(i).getId()+":"+list.get(i).getName());
}
//2、方法二 :迭代器
//创建迭代器对象!
Iterator<Product> it = list.iterator();
while(it.hasNext()){
    Product nextPro = it.next();
    System.out.println(nextPro.getId()+" : "+nextPro.getName());
}
//3、方法三:for...each
for(Product pro:list){
    System.out.println(pro.getId()+":"+pro.getName());
}  

Java集合的快速失败机制 “fail-fast”?

解决办法(多线程下如何使用ArrayList?- 前两条):

CopyOnWriteArrayList

线程安全的List:CopyOnWriteArrayList(写的时候直接copy整个数组,写的效率比较低,但读不加锁)和Collections.synchronizedList(读也要加锁,导致多线程效率低)

读写分离:

适用场景

所以 CopyOnWriteArrayList 不适合内存敏感以及对实时性要求很高的场景。

注意:CopyOnWrite类还有java.util.concurrent.CopyOnWriteArraySet,都是从jdk1.5加入的。

ArrayList Vector 的区别是什么?

这两个类都实现了 List 接口(List 接口继承了 Collection 接口),他们都是有序集合。

相同点:

不同点:

Vector类的所有方法都是同步的。可以由两个线程安全地访问一个Vector对象、但是一个线程访问Vector的话代码要在同步操作上耗费大量的时间。Arraylist不是同步的,所以在不需要保证线程安全时建议使用Arraylist。

ArrayList和LinkedList哪个更占空间

巨人的肩膀:

https://my.oschina.net/ccwwlx/blog/4311117
https://mp.weixin.qq.com/s/5J-9Kc5CewWIRm2GKSB5Lg

上一篇下一篇

猜你喜欢

热点阅读