3. 无重复字符的最长子串

2019-12-11  本文已影响0人  周英杰Anita

题目描述:

给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。

示例 1:

输入: "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:

输入: "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
示例 3:

输入: "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。

概念:滑动窗口

滑动窗口这类问题一般需要用到 双指针来进行求解,之所以是滑动窗口,是因为,遍历的时候,两个指针一前一后夹着的子串(子数组)类似一个窗口,这个窗口大小和范围会随着前后指针的移动发生变化。
我们要控制前后指针的移动来控制窗口,这样的移动是有条件的,也就是要想清楚在什么情况下移动,在什么情况下保持不变。
我的思路是保证右指针每次往前移动一格,每次移动都会有新的一个元素进入窗口,这时条件可能就会发生改变,然后根据当前条件来决定左指针是否移动,以及移动多少格。

思路:

1、初始化一个hashmap的数据结构存储 (k, v),其中 key 值为字符,value 值为字符下标 +1,加 1 表示从字符位置后一个才开始不重复;
2、定义不重复子串的开始位置为 start,结束位置为 end,也就是窗口的左右位置;
3、遍历字符串s直到start或者end到达字符串的尾部:
   1. 随着 end 不断遍历向后,如果遇到s.charAt(end)与hashmap内字符相同的情况,此时将字符s.charAt(end)作为 key 值,获取其 value 值,并更新 start ,此时 [start, end] 区间内不存在重复字符。start更新为重复字符的下个位置,start = Math.max(hashmap.get(s.charAt(end)), start)
   2. 设定不重复最长子串的长度为ans = Math.max(end-start+1, ans)
   3. 如果s.charAt(end)与hashmap内字符无重复,将该字符存储到map中,map.put(s.charAt(j), j+1);
4. 返回ans。

Java解法:

class Solution {
    public int lengthOfLongestSubstring(String s) {
       int len = s.length();
       if (len == 0)
       {
           return 0;
       }
       int i = 0, j = 0, ans = 0;
       HashMap<Character, Integer> map =new HashMap<Character, Integer>();
       while(i < len && j < len)
       {
           if(map.containsKey(s.charAt(j)))
           {
               i = Math.max(map.get(s.charAt(j)), i);
           }
           ans = Math.max(j - i + 1, ans);
           map.put(s.charAt(j), j+1);
           j++;
       }
       return ans;
    }
}

python思路(与上面思路相同,换了变量名称,添加了举例而已):

1、初始化一个char_dic的字典数据结构来存储字符和对应的,其中 key 值为字符,value 值为字符下标 +1,加 1 表示从字符位置后一个才开始不重复(后面解释);
2、定义不重复子串的开始位置为 i,结束位置为 j,也就是窗口的左右位置;
3、遍历字符串s直到i或者j到达字符串的尾部:
   1. 随着 j 不断遍历向后,如果遇到s[j]已经在char_dic中存在的情况,此时字符s[j]就是重复字符,需要调整开始位置i的值为重复字符的下一个位置,通过字符s[j]可以在字典中获取其 value 值,并更新 i = max(char_dic[s[j]], i)  ,此时 [i, j] 区间内不存在重复字符。
   2. 如果s[j]不在char_dic中,则字符s[j]就是非重复字符。
设定不重复最长子串的长度为ans = Math.max(end-start+1, ans)
   3. 计算[i,j]之间不重复子串的长度ans = max(j - i + 1, ans)
4. 返回ans。
根据上述思路举一个例子,理解为什么存储value 值为字符下标 +1?:
索引值:0 1 2 3 4 5 6
字符值:a b c b d e c
当遍历到索引值3也就是字符为b的字符时,此时i = 0, j = 3,  char_dic[a] = 1, char_dic[b] = 2, char_dic[c] = 3, 且b是重复的字符,需要调整开始位置i的值为上一次出现b字符的下一个位置,也就是 i = max(char_dic[b], i) = max(2, 0) = 2

python3解法:

class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        length = len(s)
        if length == 0:
            return 0
        i, j, ans = 0,0,0
        char_dic = {}
        while i < length and j < length:
            if s[j] in char_dic:
                i = max(char_dic[s[j]], i)
            ans = max(j - i + 1, ans)
            char_dic[s[j]] = j + 1
            j += 1
        return ans

当然,如果觉得上述,存储value 值为字符下标 +1的方式难以理解的话,也可以直接存储字符的下标值,在遇到重复字符的时候,调整开始位置,取出重复字符的下标之后+1 即可,表示重复字符的下一个字符开始计算
代码如下:

class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        length = len(s)
        if length == 0:
            return 0
        i, j, ans = 0,0,0
        char_dic = {}
        while i < length and j < length:
            if s[j] in char_dic:
                i = max(char_dic[s[j]] + 1, i)
            ans = max(j - i + 1, ans)
            char_dic[s[j]] = j 
            j += 1
        return ans

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problemset/all/

上一篇下一篇

猜你喜欢

热点阅读