java基础之集合概览
有时候需要存储一组数据,之前使用数组,但是数组具有固定的容量,但是在写程序时并不知道需要多少对象,在java.util包下提供了一套完整的集合类,包含List、Set、Queue、Map。java集合类都可以自动地调整自己的大小。
在创建集合时,经常使用泛型,可以在编译期防止将错误的类型放入到集合中。
集合概念
集合分为两个基本接口
-
集合(Collection):一个独立元素的序列,List必须已插入顺序保存元素,Set不能包含重复元素,Queue按照排队规则来确定对象产生的顺序(一般是插入顺序)
-
映射(Map):一组成对的"键值对"对象,允许使用键来查找值。map允许我们使用一个对象来查找另一个对象
Arrays.asList()的输出是一个List,但是底层实现是数组,没法调整大小。
List<String> list = Arrays.asList("123","234"); list.add("345");//java.lang.UnsupportedOperationException
List
存储有序,可以重复的元素,相当于动态数组
集合中元素所在类要重写equals方法
- ArrayList
- LinkedList
- Vector
两种类型的list
-
ArrayList:擅长随机访问元素,但在List中间插入和删除元素时速度较慢
-
LinkedList:擅长在List中间进行插入和删除操作,提供了优化的顺序访问,对于随机访问相对较慢
List特性
- 允许插入重复元素
- 允许插入多个null元素
- List提供了ListIterator迭代器,可以提供双向访问
ArrayList和Vector的异同点
相同点
-
两者都是基于索引的,内部使用数组
-
两者维护插入顺序,可以根据插入顺序来获取元素
-
ArrayList和Vector的迭代器实现都是fail-fast的
-
ArrayList和Vector两者都允许null值,也可以使用索引值对元素进行随机访问
不同点
- Vector是同步的,ArrayList不是,但是已过时,使用CopyOnWriteArrayList
- ArrayList比Vector快
LinkedList链表
LinkedList添加了一些方法,使其可以被用作栈,队列和双向队列,方法差异
-
getFirst()和element()是相同的,都是返回列表的头部,而并不删除它,如果list为空,则抛出NoSuchElementException异常。peek()方法在列表为空时返回null
-
removeFirst()和remove()方法相同,删除并返回列表头部元素,在列表为空时返回NoSuchElementException异常,poll()在列表为空时返回null
-
addFirst()在列表头部插入一个元素
-
offer()和add()和addLast()相同,在列表尾部添加一个元素
-
removeLast()删除并返回列表的最后一个元素
ArrayList和LinkedList的区别
- ArrayList是由数组支持的基于索引的数据结构,支持对元素的随机访问,复杂度为O(1),但是LinkedList是基于链表的,存储一系列的节点数据,每个节点都与前一个节点和下一个节点相连。虽然存在使用索引获取元素的方法,但是内部实现是从起始点开始遍历的,时间复杂度是O(n)
- 与ArrayList相比,在LinkedList中插入、添加和删除一个元素会更快
- LinkedList比ArrayList消耗更多内存,因为需要存储前后节点的引用
迭代器Iterators
Iterator
Iterator接口提供了遍历任何Collection的接口,取代了java集合框架中的Enumeration,迭代器允许调用者在迭代过程中移除数据
iterator只能单向移动
-
使用iterator()方法使集合返回一个Iterator。Iterator将准备好返回序列中的第一个元素。
-
使用next()方法获得序列中的下一个元素。
-
使用hasNext()方法检查序列中是否含有元素。
-
使用remove()方法将迭代器最近返回的那个元素删除。
Enumeration和iterator的区别
- Enumeration的速度是Iterator的两倍,使用内存也少,但是iterator更加安全,使得一个集合在遍历时,会阻止其他线程去修改集合,Iterator允许移除元素
- Iterator支持fail-fast机制,而Enumeration不支持,Iterator遍历时,当其他线程修改集合内容时,迭代器会立马感知到,引起快速失败,抛出ConcurrentModificationException异常
- Enumeration本身不支持同步,只是在Vector和hashtable实现Enumeration时,添加了同步
ListIterator
- ListIterator是Iterator的子类型,只能由各种List类生成,
- Iterator只能向前移动,ListIterator可以双向移动,可以生成迭代器在列表中指向位置的后一个和前一个元素的索引。
堆栈stack
堆栈是后进先出(LIFO),最后压入(push)栈的元素,第一个被弹出(pop)栈。
java1.0中有一个stack类,但是设计的不好,Java6添加了ArrayDeque,其中包含了直接实现堆栈功能的方法
- push()添加元素到栈底
- peek()和pop()返回对象,peek()返回栈顶元素,但不从栈顶删除,而pop()删除并返回栈顶元素
Set
Set不保存重复的元素。查找是Set最重要的操作,选择HashSet实现,针对快速查找进行了优化。
存储无序,不可重复
添加Set集合中的元素所在类要重写equals和hashCode方法
无序性:指的是元素在底层存储的位置是无序的
-
HashSet没有顺序,使用散列函数,HashSet维护顺序与TreeSet或LinkedHashSet不同,因为它们实现具有不同的元素存储方式
-
LinkedHashSet 也使用了散列,使用了链表来维护元素的插入顺序,结果将按元素的插入顺序显示。元素必须定义hashCode()和equals()方法,遍历元素时,会按照添加的进去的顺序
-
TreeSet将元素存储在红黑树数据结构,可以从Set中获取有序序列,其中元素必须实现Comparable接口
要求添加进TreeSet的必须是同一个类的
两种排序方式
1)自然排序:添加的类要实现Comparable接口,重写compareTo方法
2)定制排序: 使用TreeSet(Comparator<? super E> comparator) 构造器 重写compare(T o1, T o2);方法
Map
键值
key不可重复,一个key-value组成一个entry
map的分类
HashMap专为快速访问而设计,TreeMap保持键始终处于排序状态,没有HashMap快。LinkedHashMap按插入顺序保存其元素,但使用散列提供快速访问的能力。
- HashMap 基于哈希表的实现。为插入和定位键值对提供了常数时间性能。可以通过构造方法调整性能,这些构造方法允许设置哈希表的容量和装填因子。可以添加key为null,value为null
- LinkedHashMap 与HashMap类似,但是当遍历时,可以按照插入顺序或最近最少使用(LRU)顺序获取键值对。只比HashMap略慢,一个例外是在迭代时,由于其使用链表维护内部顺序,所以会更快些,按照添加进Map的顺序遍历
- TreeMap 基于红黑树实现,当查看键或键值对时,按排序顺序(由Comparable或Comparator确定)。TreeMap的侧重点在于按排序顺序获得结果。TreeMap是唯一使用subMap()方法的Map,返回红黑树的一部分,按照key所在类的指定属性进行排序,要求key是同一个类的对象(同TreeSet)
- WeakHashMap 一个具有弱键的Map,为了解决某些类型的问题,它允许释放Map所引用的对象。如果Map外没有对特定键的引用,则可以对该键进行垃圾回收
- ConcurrentHashMap 不使用同步锁定的线程安全Map
- IdentityHashMap 使用==来比较键,仅用于解决特殊问题
- HashTable 不可添加key为null,value为null的 子类Properties 处理属性文件
HashMap工作情况
HashMap在Map.Entry静态内部类实现存储键值对,HashMap使用哈希算法,在put和get方法中,使用hashCode和equals方法,使用put方法时,使用key的hashcode和哈希算法来找出存储键值对的索引,Entry存储在LinkedList中,如果存在entry,使用equals检查传递的key是否存在,如果存在,会覆盖掉value,如果不存在,会创建一个新的entry然后保存。get的时候也是先通过hashcode找到数组中的索引,然后使用equals找到正确的Entry,在进行取值
HashMap默认初始容量是32,负载因子是0.75,阈值是容量乘以负载因子,当map的大小比阈值大时,HashMap会对map的内容进行重新哈希。
HashMap和HashTable的区别
- HashMap允许key和value为null,HashTable不允许
- HashTable是同步的,HashMap不是
- HashMap可以转为LinkedHashMap,使得遍历有序,HashTable的顺序无法预知
- HashMap提供对key的set进行遍历,所以是fail-fast的,HashTable提供对key的Enumeration进行遍历,不支持fail-fast
- HashTable应该被CocurrentHashMap替代
队列
队列操作
队列是一个先进先出(FIFO)集合,LinkedList实现了Queue接口,并且提供了一些方法支持队列行为
-
offer()在队列尾部插入一个元素
-
peek()和element()返回队列头而不删除它,如果队列为空,element()抛出NoSuchElementException,而peek()返回null
-
poll()和remove()都删除并返回队头元素,如果队列为空,poll()返回null,remove()抛出NoSuchElementException
PriorityQueue优先级队列
优先级队列声明下一个弹出的元素是最需要的元素。
BlockingQueue队列
是concurrent包下的类,在进行检索或移除一个元素的时候,会等待队列变成非空;当添加一个元素的时候,会等待队列中的可用空间。主要用于实现生产者-消费者模式
Collections工具类
unmodifiableCollection方法
Collections.unmodifiableCollection(list);Collections.unmodifiableList(list);使用该方法会创建一个只读集合,所有改变集合的操作都会抛出UnsupportedOperationException
public static <T> Collection<T> unmodifiableCollection(Collection<? extends T> c) {
return new UnmodifiableCollection<>(c);
}
synchronizedCollection方法
Collections.synchronizedCollection(list)方法可以创建一个线程安全的集合
public static <T> Collection<T> synchronizedCollection(Collection<T> c) {
return new SynchronizedCollection<>(c);
}
问题
1、遍历时移除List中的元素
使用forEach和Iterator
在使用forEach遍历时,实际上是使用的Iterator,使用的核心方法是hasNext()和next(),但是使用的是list.remove,来看个例子
//源码
public class TestList {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("J");
list.add("A");
list.add("V");
list.add("A");
for (String s: list) {
list.remove(s);
}
}
}
//编译之后
public class TestList {
public TestList() {
}
public static void main(String[] args) {
List<String> list = new ArrayList();
list.add("J");
list.add("A");
list.add("V");
list.add("A");
Iterator var2 = list.iterator();
while(var2.hasNext()) {
String s = (String)var2.next();
list.remove(s);
}
}
}
之前说过,Iterator在遍历时,不允许其他线程对该集合进行操作,看一下ArrayList的iterator是怎么实现的
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
在每次获取下一个元素时,都会比较modCount 和 expectedModCount
然后在调用的list的remove方法会导致modCount增加(modCount表示被修改次数)
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
此时iterator的next方法中两个变量就不一致了,就会抛出ConcurrentModificationException异常
再看一下如果使用iterator的remove方法
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
iterator在remove之后会将modCount的值赋给expectedModCount,就不会出现两个变量不等的情况了
不使用forEach遍历
使用普通for循环,有两种方式,第一种是使用正序遍历,但是进行remove操作之后要把遍历的索引进行修正减一,否则在移除下一个的时候就会出错,第二种就是使用倒序遍历
// 正序遍历
for (int i = 0; i < list.size(); i++) {
String s = list.remove(i);
i = i - 1;
System.out.println(s);
}
//倒序遍历
for (int i = list.size() - 1; i >= 0; i--) {
String s = list.remove(i);
System.out.println(s);
}
2、fail-fast和fail-safe
java.util包中集合类被设计为fail-fast的,而java.util.concurrent中集合为fail-safe的。fail-fast迭代器抛出ConcurrentModificationException,而fail-safe迭代器从不抛出ConcurrentModificationException,Iterator的安全失败是基于对底层集合做拷贝,不受源集合上修改的影响
fail-fast
fail-fast迭代器抛出ConcurrentModificationException,通过modCount来进行实现,在进行迭代时,每次对于元素的修改都会修改该值,一旦该值被修改了,就会抛出异常
// 当Itr被实例化的时候,记录一下迭代器被实例化时ArrayList的修改次数(在用ArrayList进行add/remove操作时modCount每次都加一)
int expectedModCount = modCount;
// 检查是否被修改了
final void checkForComodification() {
// 当修改次数与Itr被实例化时的修改次数不一致时,说明在进行迭代操作的时候其他线程进行了ArrrayList的add/remove操作,此时抛出ConcurrentModificationException,即为fast-fail快速失败机制
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
3、Arrays.asList
这个方法返回的是一个ArrayList,不过这个ArrayList是Arrays类的内部类,在调用add方法的时候会直接报错
UnsupportedOperationException这是运行时异常
public void add(int index, E element) {
throw new UnsupportedOperationException();
}
本文由mdnice多平台发布