Guava记录 - 新集合类型Multiset

2019-10-18  本文已影响0人  一点温柔

一、简介

MultiSet顾名思义就是多重集合的意思,常常被用于做统计相关的业务.
官方举例说明了MultiSet解决的部分场景:

The traditional Java idiom for e.g. counting how many times a word occurs in a document is something like:

例如,计算一个单词在文档中出现的次数的传统Java习语是这样的:

Map<String, Integer> counts = new HashMap<String, Integer>();
for (String word : words) {
  Integer count = counts.get(word);
  if (count == null) {
    counts.put(word, 1);
  } else {
    counts.put(word, count + 1);
  }
}

这很尴尬,容易出错,而且不支持收集各种有用的统计数据,比如单词总数。我们可以做得更好。

Guava对以上代码做出了思考,官方解释为:

环约束:顺序无关紧要。
这就像一个没有排序约束的ArrayList:排序无关紧要。
这就像Map,包含元素和计数。

二、Multiset使用实验

实验列表如下
1、MultiSet的创建

常用的一些Multiset类,以及初始化

        //元素存放于hashMap
        Multiset hashMultiset = HashMultiset.create();
        //元素存放于LinkedHashMap
        Multiset linkedHashMultiset = LinkedHashMultiset.create();
        //元素存放于TreeMap
        Multiset treeMultiset = TreeMultiset.create();
        //元素存放于concurrentHashMap
        Multiset concurrentHashMultiset = ConcurrentHashMultiset.create();
        //不可修改的 Mutiset
        Multiset immutableMultiset = ImmutableMultiset.of("a");
2、MultiSet的基本使用

简单实验代码:

        ConcurrentHashMultiset testMultiSet = ConcurrentHashMultiset.create();
        System.out.println("=============普通添加测试数据===================");
        testMultiSet.addAll(testList);
        System.out.println("=============添加单个测试数据===================");
        testMultiSet.add("singleC");
        System.out.println("=============添加指定次数的单个测试数据===================");
        testMultiSet.add("MutleC5", 5);
        System.out.println("=============测试输出指定元素测试===================");
        System.out.println(testMultiSet.count("a"));
        System.out.println("=============测试修改指定元素数量===================");
        //值得注意的是调用设置指定元素次数的时候会返回原有次数
        //如果设置次数为0的时候原有元素不会出现在当前的视图里面
        System.out.println(testMultiSet.setCount("a", 3));
        System.out.println(testMultiSet.setCount("assign0", 0));
        System.out.println(testMultiSet.setCount("assign3", 3));

        System.out.println("=============测试输出试图数据===================");
        System.out.println(testMultiSet.entrySet());
        System.out.println("=============测试输出元素数据===================");
        System.out.println(testMultiSet.elementSet());

实验结果:

=============普通添加测试数据===================
=============添加单个测试数据===================
=============添加指定次数的单个测试数据===================
=============测试输出指定元素测试===================
2
=============测试修改指定元素数量===================
2
0
0
=============测试输出试图数据===================
[a x 3, b x 3, c, singleC, MutleC5 x 5, assign3 x 3]
=============测试输出元素数据===================
[a, b, c, singleC, MutleC5, assign3]
3、值得注意的是

a、多集实现的内存消耗在不同元素的数量上是线性的。

b、Multiset与Collection接口的契约完全一致,除了在JDK本身有先例的极少数情况下——特别是TreeMultiset,像TreeSet一样,使用比较来实现相等,而不是Object.equals。

c、特别是,每次出现一个元素时,Multiset.addAll(Collection)都会在集合中添加一个对应的元素,这比上面的Map方法所需的for循环要方便得多。

......未完待续

上一篇下一篇

猜你喜欢

热点阅读