49. 字母异位词分组

2020-11-22  本文已影响0人  滨岩

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入: ["eat", "tea", "tan", "ate", "nat", "bat"]
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
说明:

所有输入均为小写字母。
不考虑答案输出的顺序。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/group-anagrams
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

方案一:

先将字母排序,然后映射到字典map中

image.png
    public List<List<String>> groupAnagrams(String[] strs) {

        List<List<String>> list = new ArrayList<>();

        HashMap<String, List<String>> map = new HashMap<>();
        for (String str : strs) {
            char[] arr = str.toCharArray();

            //排序
            Arrays.sort(arr);

            String key = String.valueOf(arr);

            //字典归类
            if (map.containsKey(key)) {
                map.get(key).add(str);
            } else {
                List<String>  sublist=new ArrayList<>();
                sublist.add(str);
                map.put(key, sublist);
            }
        }

        return new ArrayList<List<String>>(map.values());
    }

时间复杂度:排序的话算作 O(K log(K)),最外层的 for 循环,所以就是 O(n K log(K))。

空间复杂度:O(NK),用来存储结果。

方案二:

参考这里,利用算术基本定理

算术基本定理,又称为正整数的唯一分解定理,即:每个大于1的自然数,要么本身就是质数,要么可以写为2个以上的质数的,而且这些质因子按大小排列之后,写法仅有一种方式。

利用这个,我们把每个字符串都映射到一个正数上。

用一个数组存储质数 prime = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103}。

然后每个字符串的字符减去 ' a ' ,然后取到 prime 中对应的质数。把它们累乘。

例如 abc ,就对应 'a' - 'a', 'b' - 'a', 'c' - 'a',即 0, 1, 2,也就是对应素数 2 3 5,然后相乘 2 *3 *5 = 30,就把 "abc" 映射到了 30。

image.png
 public List<List<String>> groupAnagrams(String[] strs) {

        //每个字母对应一个质数
        //每个字母对应一个质数
        int[] prime = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113,
                127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199};
        List<List<String>> list = new ArrayList<>();

        HashMap<Integer, List<String>> map = new HashMap<>();
        for (String str : strs) {
            char[] arr = str.toCharArray();

            int key = 1;
            for (char s : arr) {
                //防止 a-'a'=0 导致  所有改为 s-'a'+1  a,aa是同一个的bug 的不过
                key *= prime[s - 'a'+1];
            }


            //字典归类
            if (map.containsKey(key)) {
                map.get(key).add(str);
            } else {
                List<String> sublist = new ArrayList<>();
                sublist.add(str);
                map.put(key, sublist);
            }
        }

        return new ArrayList<List<String>>(map.values());
    }
image.png

时间复杂度:O(n * K),K 是字符串的最长长度。

空间复杂度:O(NK),用来存储结果。

这个解法时间复杂度,较解法二有提升,但是有一定的局限性,因为求 key 的时候用的是累乘,可能会造成溢出,超出 int 所能表示的数字。

方案三:

参考这里,记录字符串的每个字符出现的次数从而完成映射。因为有 26 个字母,不好解释,我们假设只有 5 个字母,来看一下怎么完成映射。

首先初始化 key = "0#0#0#0#0#",数字分别代表 abcde 出现的次数,# 用来分割。

这样的话,"abb" 就映射到了 "1#2#0#0#0"。

"cdc" 就映射到了 "0#0#2#1#0"。

"dcc" 就映射到了 "0#0#2#1#0"。

 public List<List<String>> groupAnagrams(String[] strs) {

        Map<String, List<String>> map = new HashMap<>();

        for (String str : strs) {

            int[] freq = new int[26];

            StringBuilder stringBuilder = new StringBuilder(100);

            //记录每个字符的次数
            for (int i = 0; i < str.length(); i++) {
                freq[str.charAt(i) - 'a'] ++;
            }

            for (int i = 0; i < freq.length; i++) {
                stringBuilder.append("#" + freq[i]);
            }

            String key = stringBuilder.toString();

            if (map.containsKey(key)) {
                map.get(key).add(str);
                continue;
            }

            List<String> list = new ArrayList<>();
            list.add(str);

            map.put(key, list);
        }

        return new ArrayList<List<String>>(map.values());
    }

时间复杂度: O(nK)。

空间复杂度:O(NK),用来存储结果。

上一篇下一篇

猜你喜欢

热点阅读