大数据

Java集合总结:Set集合

2020-02-19  本文已影响0人  喵感数据
Set集合(HashSet是典型实现)

set集合特点:
1.无序性:set集合是无序的
2.不可重复:set集合是不可重复的

HashSet详解:
1、HashSet:不能保证元素的顺序;不可重复;不是线程安全的;集合元素可以为 NULL;

2、其底层其实是一个数组,存在的意义是加快查询速度。在一般的数组中,元素在数组中的索引位置是随机的,元素的取值和元素的位置之间不存在确定的关系。
因此,在数组中查找特定的值时,需要把查找值和一系列的元素进行比较,此时的查询效率依赖于查找过程中比较的次数。
HashSet 集合底层数组的索引和值有一个确定的关系:index=hash(value),那么只需要调用这个公式,就能快速的找到元素或者索引。

3、对于 HashSet: 如果两个对象通过 equals() 方法返回 true,这两个对象的 hashCode 值也应该相同。

HashSet的hashCode值

当向HashSet集合中存入一个元素时,HashSet会先判断该对象的hashCode值,然后根据hashCode值决定该对象在HashSet中的存储位置。
一、如果 hashCode 值不同,直接把该元素存储到 hashCode() 指定的位置
二、如果 hashCode 值相同,那么会继续判断该元素和集合对象的 equals() 作比较。
1、hashCode 相同,equals 为 true,则视为同一个对象,不保存在 hashSet()中
2、hashCode 相同,equals 为 false,则存储在之前对象同槽位的链表上,这非常麻烦,我们应该约束这种情况,即保证:如果两个对象通过 equals() 方法返回 true,这两个对象的 hashCode 值也应该相同。

注意:每一个存储到 哈希 表中的对象,都得提供 hashCode() 和 equals() 方法的实现,用来判断是否是同一个对象

常见的 hashCode()算法

LinkedHashSet集合:有序,不可重复。
因为底层采用 链表 和 哈希表的算法。链表保证元素的添加顺序,哈希表保证元素的唯一性

TreeSet:有序,不可重复,底层使用红黑树算法,擅长于范围查询。
如果使用 TreeSet() 无参数的构造器创建一个 TreeSet 对象, 则要求放入其中的元素的类必须实现 Comparable 接口所以, 在其中不能放入 null 元素。

注意:必须放入同样类的对象(默认会进行排序) 否则可能会发生类型转换异常,我们可以使用泛型来进行限制

 Set treeSet = new TreeSet();
 //添加一个 Integer 类型的数据
 treeSet.add(1);  
 //添加一个 String 类型的数据
 treeSet.add("a");  
 //会报类型转换异常的错误
 System.out.println(treeSet);  

自动排序:添加自定义对象的时候,必须要实现 Comparable 接口,并要覆盖 compareTo(Object obj) 方法来自定义比较规则
如果 this > obj,返回正数 1
如果 this < obj,返回负数 -1
如果 this = obj,返回 0 ,则认为这两个对象相等

public class TreeSetTest {
    public static void main(String[] args) {
        Person p1 = new Person(1);
        Person p2 = new Person(2);
        Person p3 = new Person(3);
         
        Set<Person> set = new TreeSet<>(new Person());
        set.add(p1);
        set.add(p2);
        set.add(p3);
        System.out.println(set);  //结果为[1, 2, 3]
    }
 
}
 
class Person implements Comparator<Person>{
    public int age;
    public Person(){}
    public Person(int age){
        this.age = age;
    }
    @Override
    /***
     * 根据年龄大小进行排序
     */
    public int compare(Person o1, Person o2) {
        // TODO Auto-generated method stub
        if(o1.age > o2.age){
            return 1;
        }else if(o1.age < o2.age){
            return -1;
        }else{
            return 0;
        }
    }
     
    @Override
    public String toString() {
        // TODO Auto-generated method stub
        return ""+this.age;
    }
}

当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保证该方法与 compareTo(Object obj) 方法有一致的结果。

HashSet、LinkedHashSet和TreeSet三个 Set 接口的实现类比较:

相同点:
1、都不允许元素重复
2、都不是线程安全的 解决办法:Set set = Collections.synchronizedSet(set 对象)

不同点:
HashSet:不保证元素的添加顺序,底层采用 哈希表算法,查询效率高。判断两个元素是否相等,equals() 方法返回 true,hashCode() 值相等。即要求存入 HashSet 中的元素要覆盖 equals() 方法和 hashCode()方法

LinkedHashSet:HashSet 的子类,底层采用了 哈希表算法以及 链表算法,既保证了元素的添加顺序,也保证了查询效率。但是整体性能要低于 HashSet

TreeSet:不保证元素的添加顺序,但是会对集合中的元素进行排序。底层采用 红-黑 树算法(树结构比较适合范围查询)

上一篇下一篇

猜你喜欢

热点阅读