Java集合类简介（java.util)

2019-03-23 本文已影响0人 somelou

原文：Java集合类介绍

通常，我们的程序需要根据程序运行时才知道创建多少个对象。但若非程序运行，程序开发阶段，我们根本不知道到底需要多少个数量的对象，甚至不知道它的准确类型。为了满足这些常规的编程需要，我们要求能在任何时候，任何地点创建任意数量的对象，而这些对象用什么来容纳呢？我们首先想到了数组，但是数组只能放统一类型的数据，而且其长度是固定的，那怎么办呢？集合便应运而生了。

集合与数组

数组（可以存储基本数据类型）是用来存现对象的一种容器，但是数组的长度固定，不适合在对象数量未知的情况下使用。

集合（只能存储对象，对象类型可以不一样）的长度可变，可在多数情况下使用。

Java集合类存放于 java.util 包中，是一个用来存放对象的容器。

集合只能存放对象。比如你存一个 int 型数据 1放入集合中，其实它是自动转换成 Integer 类后存入的，Java中每一种基本类型都有对应的引用类型。
集合存放的是多个对象的引用，对象本身还是放在堆内存中。
集合可以存放不同类型，不限数量的数据类型。

集合中的接口和类的关系

Collection接口是集合类的根接口，Java中没有提供这个接口的直接的实现类。但是却让其被继承产生了两个接口，就是Set和List。Set中不能包含重复的元素。List是一个有序的集合，可以包含重复的元素，提供了按索引访问的方式。

Map是Java.util包中的另一个接口，它和Collection接口没有关系，是相互独立的，但是都属于集合类的一部分。Map包含了key-value对。Map不能包含重复的key，但是可以包含相同的value。

Iterator所有的集合类，都实现了Iterator接口，这是一个用于遍历集合中元素的接口，主要包含以下三种方法：
1.hasNext()是否还有下一个元素。
2.next()返回下一个元素。
3.remove()删除当前元素。

因为是接口，我们不能直接new对象，所以我们主要使用的是他们的实现类。

Q1.有序和无序指什么？

有序即你从List中取出元素的顺序和你存入的顺序相对应；无序即Set中取数据的顺序和存入的顺序没有对应关系。

Q2.Map的一个key可以存多个value吗？

网上有使用IdentityHashMap"实现"一个key中保存多个value。下面是那段代码的例子：

import java.util.IdentityHashMap;
import java.util.Map;
import java.util.Map.Entry;
 
public class MapTest {
  public static void main(String[] args) {
      
      String str1 = new String("xx");
      String str2 = new String("xx");
      System.out.println(str1 == str2);
      
      Map<String ,String> map = new IdentityHashMap<String ,String>();
      map.put(str1, "hello");
      map.put(str2, "world");
  
      
      for(Entry<String,String> entry : map.entrySet())
      {
          System.out.println(entry.getKey()+"   " + entry.getValue());
      }
      System.out.println("     containsKey---> " + map.containsKey("xx"));
      System.out.println("str1 containsKey---> " + map.containsKey(str1));
      System.out.println("str2 containsKey---> " + map.containsKey(str2));
      System.out.println("      value----> " + map.get("xx"));
      System.out.println("str1  value----> " + map.get(str1));
      System.out.println("str2  value----> " + map.get(str2));
  }
}

输出的结果为：

false
xx   world
xx   hello
     containsKey---> false
str1 containsKey---> true
str2 containsKey---> true
     value----> null
str1  value----> hello
str2  value----> world

从输出结果可以看出，xx能够同时对应两个value不是因为一个key保存了多个值，而是因为srt1和str2通过new产生了不同的地址，相当于是两个不同的key。

apache commons工具包里有个org.apache.commons.collections.map.MultiValueMap，可以更好的完成这个功能。

import org.apache.commons.collections.map.MultiValueMap;
import java.util.Collection;
 
public class TestMain
{
    public static void main(String[] args) throws IOException
    {
                MultiValueMap mailMap = new MultiValueMap();
                 mailMap.put("number", "1");
                 mailMap.put("number", "30");
                 mailMap.put("name", "wang");
                 mailMap.put("card", "12344");
                 mailMap.put("card", "65432");
 
                Collection mapcoll = null;
                mapcoll = mailMap.getCollection("card");
                Iterator ii = mapcoll.iterator();
                while(ii.hasNext()){
                   String mailValue = (String) ii.next();
                   System.out.println(mailValue);
                }
   }
   
}

因为我没下这个工作包，没有运行过这段代码，应该是能实现的

在网上，我也找到了一个博主自己写的MultiValueMap，实现了一个key存多个值。详情：Map之一个Key存多个Value的MultiValueMap(一个键多个值)

常用集合类介绍

常用的List、Map、Set三个接口，存取元素时，有以下特点：

List ：以特定顺序来持有元素，可以有重复元素。

Set ：不能有重复元素,内部排序。

Map ：保存key-value值，value可多值。

list, set,map对比

接口	子接口	是否有序	是否允许元素重复
Collection		否
List	ArrayList	否	是
	LinkedList	否	是
	Vector	否	是
Set	AbstractSet	否	否
	HashSet	否	否
	TreeSet	是（用二叉排序树）	否
Map	AbstractMap	否	使用key-value来映射和存储数据，key必须唯一，value可以重复
	HashMap		否
	TreeMap	是（用二叉排序树）	使用key-value来映射和存储数据，key必须唯一，value可以重复

Java集合的层次图

List

List里存放的对象是有序的，同时也是可以重复的，List关注的是索引，拥有一系列和索引相关的方法，查询速度快。因为往list集合里插入或删除数据时，会伴随着后面数据的移动，所有插入删除数据速度慢。

ArrayList

ArrayList 是一个可改变大小的数组.当更多的元素加入到ArrayList中时,其大小将会动态地增长.内部的元素可以直接通过get与set方法进行访问,因为ArrayList本质上就是一个数组.

在初始化ArrayList时，会构建空数组（Object[] elementData={}）。ArrayList是一个无序的，它是按照添加的先后顺序排列，当然，他也提供了sort方法，如果需要对ArrayList进行排序，只需要调用这个方法，提供Comparator比较器即可.

LinkedList

LinkedList是基于链表的，它是一个双向链表，每个节点维护了一个prev和next指针。同时对于这个链表，维护了first和last指针，first指向第一个元素，last指向最后一个元素。LinkedList是一个无序的链表，按照插入的先后顺序排序，不提供sort方法对内部元素排序。

在添加和删除元素时具有比ArrayList更好的性能.但在get与set方面弱于ArrayList.当然,这些对比都是指数据量很大或者操作很频繁的情况下的对比,如果数据和运算量很小,那么对比将失去意义.

遍历

在类集中提供了以下四种的常见输出方式：

Iterator：迭代输出，是使用最多的输出方式。
ListIterator：是Iterator的子接口，专门用于输出List中的内容。
foreach输出：JDK1.5之后提供的新功能，可以输出数组或集合。
for循环

代码示例如下：

//for的形式：
for（int i=0;i<arr.size();i++）{...}
//foreach的形式： 
for（int　i：arr）{...}
//iterator的形式：
Iterator it = arr.iterator();
while(it.hasNext()){ object o =it.next(); ...}

Q1.迭代、遍历、循环、迭代的区别

表示“重复”这个含义的词有很多, 比如循环(loop), 递归(recursion), 遍历(traversal), 迭代(iterate).

循环算是最基础的概念, 凡是重复执行一段代码, 都可以称之为循环。大部分的递归, 遍历, 迭代, 都是循环.

递归是重复调用函数自身实现循环，将简单情况逐步转化为基本情况。

迭代是函数内某段代码实现循环，而迭代与普通循环的区别是：循环代码中参与运算的变量同时是保存结果的变量，当前保存的结果作为下一次循环计算的初始值。

Vector

Vector 和ArrayList类似,但属于强同步类（？）。如果你的程序本身是线程安全的(thread-safe,没有在多个线程之间共享同一个集合/对象),那么使用ArrayList是更好的选择。

效率太低，正在被淘汰。

Set

Set里存放的对象是无序，不能重复的，集合中的对象不按特定的方式排序，只是简单地把对象加入集合中。

HashSet

HashSet是基于HashMap来实现的，操作很简单，更像是对HashMap做了一次“封装”，而且只使用了HashMap的key来实现各种特性，而HashMap的value始终都是PRESENT。

HashSet不允许重复（HashMap的key不允许重复，如果出现重复就覆盖），允许null值，非线程安全。

TreeSet

基于 TreeMap 的 NavigableSet 实现。使用元素的自然顺序对元素进行排序，或者根据创建 set 时提供的 Comparator进行排序，具体取决于使用的构造方法。

遍历

对它的遍历和List类似。

迭代遍历

Set<String> set = new HashSet<String>();  
Iterator<String> it = set.iterator();  
while (it.hasNext()) {  
  String str = it.next();  
  System.out.println(str);  
}

for(each)循环遍历

for (String str : set) {  
      System.out.println(str);  
}

Map

Map集合中存储的是键值对，键不能重复，值可以重复。根据键得到值，对map集合遍历时先得到键的set集合，对set集合进行遍历，得到相应的值。

HashMap

数组方式存储key/value，线程非安全，允许null作为key和value，key不可以重复，value允许重复，不保证元素迭代顺序是按照插入时的顺序，key的hash值是先计算key的hashcode值，然后再进行计算，每次容量扩容会重新计算所以key的hash值，会消耗资源，要求key必须重写equals和hashcode方法。

默认初始容量16，加载因子0.75，扩容为旧容量乘2，查找元素快，如果key一样则比较value，如果value不一样，则按照链表结构存储value，就是一个key后面有多个value。

Hashtable

Hashtable与HashMap类似，但它的方法是同步的，HashMap未经同步，所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样，因此也导致了Hashtale在写入时会比较慢。

它继承自Dictionary类，不同的是Hashtable不允许 null 值(key 和 value 都不可以)，HashMap允许 null 值(key和value都可以)。

LinkedHashMap

LinkedHashMap保存了记录的插入顺序，在用Iteraor遍历LinkedHashMap时，先得到的记录肯定是先插入的，在遍历的时候会比HashMap慢，有HashMap的全部特性。

TreeMap

基于红黑二叉树的NavigableMap的实现，线程非安全，不允许null，key不可以重复，value允许重复，存入TreeMap的元素应当实现Comparable接口或者实现Comparator接口，会按照排序后的顺序迭代元素，两个相比较的key不得抛出classCastException。主要用于存入元素的时候对元素进行自动排序，迭代输出的时候就按排序顺序输出。

遍历

KeySet()
将Map中所有的键存入到set集合中。因为set具备迭代器。所有可以迭代方式取出所有的键，再根据get方法。获取每一个键对应的值。 keySet():迭代后只能通过get()取key 。
取到的结果会乱序，是因为取得数据行主键的时候，使用了HashMap.keySet()方法，而这个方法返回的Set结果，里面的数据是乱序排放的。
```
Map map = new HashMap();
map.put("key1","lisi1");
map.put("key2","lisi2");
map.put("key3","lisi3");
map.put("key4","lisi4");  
//先获取map集合的所有键的set集合，keyset（）
Iterator it = map.keySet().iterator();
//获取迭代器
while(it.hasNext()){
    Object key = it.next();
    System.out.println(map.get(key));
}
```

values()

获取所有的值，Collection values()不能获取到key对象

Collection<String> vs = map.values();
Iterator<String> it = vs.iterator();
while (it.hasNext()) {
     String value = it.next();
     System.out.println(" value=" + value);
}

entrySet()
Set<Map.Entry<K,V>> entrySet() //返回此映射中包含的映射关系的 Set 视图。（一个关系就是一个键-值对），就是把(key-value)作为一个整体一对一对地存放到Set集合当中的。Map.Entry表示映射关系。

entrySet()：迭代后可以e.getKey()，e.getValue()两种方法来取key和value。返回的是Entry接口。
典型用法如下：

// 返回的Map.Entry对象的Set集合 Map.Entry包含了key和value对象
Set<Map.Entry<Integer, String>> es = map.entrySet();
Iterator<Map.Entry<Integer, String>> it = es.iterator();
while (it.hasNext()) {
   // 返回的是封装了key和value对象的Map.Entry对象
   Map.Entry<Integer, String> en = it.next();

   // 获取Map.Entry对象中封装的key和value对象
   Integer key = en.getKey();
   String value = en.getValue();
   System.out.println("key=" + key + " value=" + value);
}

推荐使用第三种方式，即entrySet()方法，效率较高。

对于keySet其实是遍历了2次，一次是转为iterator，一次就是从HashMap中取出key所对于的value。而entryset只是遍历了第一次，它把key和value都放到了entry中，所以快了。两种遍历的遍历时间相差还是很明显的。

总结

Vector和ArrayList

vector是线程同步的，所以它也是线程安全的，而arraylist是线程异步的，是不安全的。如果不考虑到线程的安全因素，一般用arraylist效率比较高。
如果集合中的元素的数目大于目前集合数组的长度时，vector增长率为目前数组长度的100%，而arraylist增长率为目前数组长度的50%。如果在集合中使用数据量比较大的数据，用vector有一定的优势。
如果查找一个指定位置的数据，vector和arraylist使用的时间是相同的，如果频繁的访问数据，这个时候使用vector和arraylist都可以。而如果移动一个指定位置会导致后面的元素都发生移动，这个时候就应该考虑到使用linklist,因为它移动一个指定位置的数据时其它元素不移动。
ArrayList 和Vector是采用数组方式存储数据，此数组元素数大于实际存储的数据以便增加和插入元素，都允许直接序号索引元素，但是插入数据要涉及到数组元素移动等内存操作，所以索引数据快，插入数据慢，Vector由于使用了synchronized方法（线程安全）所以性能上比ArrayList要差，LinkedList使用双向链表实现存储，按序号索引数据需要进行向前或向后遍历，但是插入数据时只需要记录本项的前后项即可，所以插入数度较快。

ArrayList和LinkedList

ArrayList是实现了基于动态数组的数据结构，LinkedList基于链表的数据结构。
对于随机访问get和set，ArrayList觉得优于LinkedList，因为LinkedList要移动指针。
对于新增和删除操作add和remove，LinedList比较占优势，因为ArrayList要移动数据。这一点要看实际情况的。若只对单条数据插入或删除，ArrayList的速度反而优于LinkedList。但若是批量随机的插入删除数据，LinkedList的速度大大优于ArrayList. 因为ArrayList每插入一条数据，要移动插入点及之后的所有数据。

HashMap与TreeMap

HashMap通过hashcode对其内容进行快速查找，而TreeMap中所有的元素都保持着某种固定的顺序，如果你需要得到一个有序的结果你就应该使用TreeMap（HashMap中元素的排列顺序是不固定的）。
在Map 中插入、删除和定位元素，HashMap是最好的选择。但如果您要按自然顺序或自定义顺序遍历键，那么TreeMap会更好。使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。
两个map中的元素一样，但顺序不一样，导致hashCode()不一样。

同样做测试：

在HashMap中，同样的值的map,顺序不同，equals时，false;

而在treeMap中，同样的值的map,顺序不同,equals时，true，说明，treeMap在equals()时是整理了顺序了的。

HashTable与HashMap

同步性:Hashtable是线程安全的，也就是说是同步的，而HashMap是线程序不安全的，不是同步的。
HashMap允许存在一个为null的key，多个为null的value 。
hashtable的key和value都不允许为null。

参考文献

杨立果：java集合（list,set,map)
技术特工队：java Map 一个key其实可以保存多个value
Warren技术宅：MultiValueMap的用法（一个key对应多个value）
YSOcean：Java 集合详解