总结:Java 集合进阶精讲
集合进阶1---为集合指定初始容量
集合在Java编程中使用非常广泛,当容器的量变得非常大的时候,它的初始容量就会显得很重要了.
因为扩容是需要消耗大量的人力物力财力的。
同样的道理,Collection的初始容量也显得异常重要。所以:对于已知的情景,请为集合指定初始容量。
import java.util.ArrayList;
import java.util.List;
public class ColTest {
public static void main(String[] args) {
Base_User baseUser = null;
long begin1 = System.currentTimeMillis();
List<Base_User> list1 = new ArrayList<Base_User>();
for(int i = 0 ; i < 1000000; i++){
baseUser = new Base_User(i,"chenssy_"+i,i);
list1.add(baseUser);
}
long end1 = System.currentTimeMillis();
System.out.println("list1 time:" + (end1 - begin1));
long begin2 = System.currentTimeMillis();
List<Base_User> list2 = new ArrayList<>(1000000);
for(int i = 0 ; i < 1000000; i++){
baseUser = new Base_User(i,"chenssy_"+i,i);
list2.add(baseUser);
}
long end2 = System.currentTimeMillis();
System.out.println("list2 time:" + (end2 - begin2));
}
}
分析:
插入1000000条数据,list1没有没有申请初始化容量,而list2初始化容量1000000。运行结果我们可以看出list2的速度是list1的两倍左右。
ArrayList的扩容机制是比较消耗资源的。我们先看ArrayList的add方法:
public boolean add(E e) {
ensureCapacity(size + 1);
elementData[size++] = e;
return true;
}
public void ensureCapacity(int minCapacity) {
modCount++; //修改计数器
int oldCapacity = elementData.length;
//当前需要的长度超过了数组长度,进行扩容处理
if (minCapacity > oldCapacity) {
Object oldData[] = elementData;
//新的容量 = 旧容量 * 1.5 + 1
int newCapacity = (oldCapacity * 3)/2 + 1;
if (newCapacity < minCapacity)
newCapacity = minCapacity;
//数组拷贝,生成新的数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
}
ArrayList每次新增一个元素,就会检测ArrayList的当前容量是否已经到达临界点,如果到达临界点则会扩容1.5倍。
然而ArrayList的扩容以及数组的拷贝生成新的数组是相当耗资源的。
大数据量的前提下,指定初始化容量,效率的提升和资源的利用会显得更加具有优势。
集合进阶2---使用entrySet遍历Map集合KV
HashMap的遍历有两种常用的方法,那就是使用keyset及entryset来进行遍历
但两者的遍历速度是有差别的。
第一种: entryset 效率高
Map map = new HashMap();
Iterator iter = map.entrySet().iterator();
while (iter.hasNext()) {
Map.Entry entry = (Map.Entry) iter.next();
Object key = entry.getKey();
Object val = entry.getValue();
}
第二种: keySet 效率低
Map map = new HashMap();
Iterator iter = map.keySet().iterator();
while (iter.hasNext()) {
Object key = iter.next();
Object val = map.get(key);
}
对于keySet其实是遍历了2次,一次是转为iterator,一次就从hashmap中取出key所对于的value。
而entryset只是遍历了第一次,他把key和value都放到了entry中,所以就快了。
集合进阶3---合理利用集合的稳定性和有序性
合理利用集合的稳定性(order)和有序性(sort),避免集合的无序性和不稳定性带来的负面影响。
- 稳定性指集合每次遍历的元素次序是一定的。
- 有序性是指遍历的结果按某种比较规则依次排序的。
ArrayList是order/unsort,HashMap是unorder/unsort,TreeSet是order/sort,还可以通过TreeSet结合ArrayList对结果进行排序。
Java 常用集合的一些特征:
-
①、LinkedList 底层是双向链表。ArrayList:底层采用数组结构,里面添加的元素有序可以重复。
-
②、HashSet:底层采用哈希表算法,里面添加的元素无序不可重复。
-
③、HashMap:底层也是采用哈希表算法,但是里面添加的元素是 key-value 的形式。key 不允许重复,value 可以。
如何好好利用这些集合的原理,简化我们的编程呢。
1、统计一字符串中每个字符出现的次数?
解析:给定一串字符串,统计每个字符出现的次数。统计的字符是不能重复的,而出现的个数我们可以不用管。那么很容易联想到 Map 的集合原理,key-value。我们将统计的字符放在 Map<Character,Integer>中是一种很好的实现方式。
HashMap
import java.util.HashMap;
import java.util.Map;
public class CnTest {
public static Map<Character, Integer> countChar(Map<Character, Integer> map,String str){
//将所给的字符串解析为一个字符构造的数组
char[] chars = str.toCharArray();
for(char c : chars){
if(map.containsKey(c)){
int oldCount = map.get(c);
map.put(c, oldCount+1);
}else{
map.put(c, 1);
}
}
return map;
}
public static void main(String[] args) {
String str = "hello world";
//定义一个 Map 集合,用来存放统计的 字符--个数
Map<Character, Integer> hashMap = new HashMap<Character, Integer>();
System.out.println(countChar(hashMap,str));
//{w=1, d=1, =1, e=1, r=1, o=2, l=3, h=1}
}
}
补充:这里我们用来保存统计字符的是 HashMap 的实现类,这里打印出来的字符统计是无序的。
LinkedHashMap
根据字符串给定的顺序有序的统计出
public static void main(String[] args) {
String str = "hello world";
//定义一个 Map 集合,用来存放统计的 字符--个数
Map<Character, Integer> linkedHashMap = new LinkedHashMap<Character, Integer>();
System.out.println(countChar(linkedHashMap,str));
//{h=1, e=1, l=3, o=2, =1, w=1, r=1, d=1}
}
TreeMap
用 uicode 的编码顺序打印给定的字符串
public static void main(String[] args) {
String str = "hello world";
//定义一个 Map 集合,用来存放统计的 字符--个数
Map<Character, Integer> treeMap = new TreeMap<Character, Integer>();
System.out.println(countChar(treeMap,str));
//{ =1, d=1, e=1, h=1, l=3, o=2, r=1, w=1}
}
二、去掉给定数组重复的数据?
解析:将数组中的元素都放到Set,然后将 Set 集合转变为数组就可以了。
import java.util.HashSet;
import java.util.Set;
public class CrTest {
public static Integer[] clearRepeat(int [] array){
Set<Integer> set = new HashSet<Integer>();
for(int i : array){
set.add(i);
}
Integer[] newArray = set.toArray(new Integer[set.size()]);
return newArray;
}
public static void main(String[] args) {
//创建一个数组,可以看出 2和4 是重复的
int [] array = {1,2,3,4,2,2,3,4};
Integer[] newArray = clearRepeat(array);
for(Integer i : newArray){
System.out.println(i);
}
//1 2 3 4
}
}
同理我们可以改变 Set 集合的实现类,hashSet 是无序的,我们可以会用** LinkedHashSet** 保证既定顺序;TreeSet 保证自然顺序
over