3. 无重复字符的最长子串
2019-12-11 本文已影响0人
周英杰Anita
题目描述:
给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。
示例 1:
输入: "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:
输入: "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
示例 3:
输入: "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。
概念:滑动窗口
滑动窗口这类问题一般需要用到 双指针来进行求解,之所以是滑动窗口,是因为,遍历的时候,两个指针一前一后夹着的子串(子数组)类似一个窗口,这个窗口大小和范围会随着前后指针的移动发生变化。
我们要控制前后指针的移动来控制窗口,这样的移动是有条件的,也就是要想清楚在什么情况下移动,在什么情况下保持不变。
我的思路是保证右指针每次往前移动一格,每次移动都会有新的一个元素进入窗口,这时条件可能就会发生改变,然后根据当前条件来决定左指针是否移动,以及移动多少格。
思路:
1、初始化一个hashmap的数据结构存储 (k, v),其中 key 值为字符,value 值为字符下标 +1,加 1 表示从字符位置后一个才开始不重复;
2、定义不重复子串的开始位置为 start,结束位置为 end,也就是窗口的左右位置;
3、遍历字符串s直到start或者end到达字符串的尾部:
1. 随着 end 不断遍历向后,如果遇到s.charAt(end)与hashmap内字符相同的情况,此时将字符s.charAt(end)作为 key 值,获取其 value 值,并更新 start ,此时 [start, end] 区间内不存在重复字符。start更新为重复字符的下个位置,start = Math.max(hashmap.get(s.charAt(end)), start)
2. 设定不重复最长子串的长度为ans = Math.max(end-start+1, ans)
3. 如果s.charAt(end)与hashmap内字符无重复,将该字符存储到map中,map.put(s.charAt(j), j+1);
4. 返回ans。
Java解法:
class Solution {
public int lengthOfLongestSubstring(String s) {
int len = s.length();
if (len == 0)
{
return 0;
}
int i = 0, j = 0, ans = 0;
HashMap<Character, Integer> map =new HashMap<Character, Integer>();
while(i < len && j < len)
{
if(map.containsKey(s.charAt(j)))
{
i = Math.max(map.get(s.charAt(j)), i);
}
ans = Math.max(j - i + 1, ans);
map.put(s.charAt(j), j+1);
j++;
}
return ans;
}
}
python思路(与上面思路相同,换了变量名称,添加了举例而已):
1、初始化一个char_dic的字典数据结构来存储字符和对应的,其中 key 值为字符,value 值为字符下标 +1,加 1 表示从字符位置后一个才开始不重复(后面解释);
2、定义不重复子串的开始位置为 i,结束位置为 j,也就是窗口的左右位置;
3、遍历字符串s直到i或者j到达字符串的尾部:
1. 随着 j 不断遍历向后,如果遇到s[j]已经在char_dic中存在的情况,此时字符s[j]就是重复字符,需要调整开始位置i的值为重复字符的下一个位置,通过字符s[j]可以在字典中获取其 value 值,并更新 i = max(char_dic[s[j]], i) ,此时 [i, j] 区间内不存在重复字符。
2. 如果s[j]不在char_dic中,则字符s[j]就是非重复字符。
设定不重复最长子串的长度为ans = Math.max(end-start+1, ans)
3. 计算[i,j]之间不重复子串的长度ans = max(j - i + 1, ans)
4. 返回ans。
根据上述思路举一个例子,理解为什么存储value 值为字符下标 +1?:
索引值:0 1 2 3 4 5 6
字符值:a b c b d e c
当遍历到索引值3也就是字符为b的字符时,此时i = 0, j = 3, char_dic[a] = 1, char_dic[b] = 2, char_dic[c] = 3, 且b是重复的字符,需要调整开始位置i的值为上一次出现b字符的下一个位置,也就是 i = max(char_dic[b], i) = max(2, 0) = 2
python3解法:
class Solution:
def lengthOfLongestSubstring(self, s: str) -> int:
length = len(s)
if length == 0:
return 0
i, j, ans = 0,0,0
char_dic = {}
while i < length and j < length:
if s[j] in char_dic:
i = max(char_dic[s[j]], i)
ans = max(j - i + 1, ans)
char_dic[s[j]] = j + 1
j += 1
return ans
当然,如果觉得上述,存储value 值为字符下标 +1的方式难以理解的话,也可以直接存储字符的下标值,在遇到重复字符的时候,调整开始位置,取出重复字符的下标之后+1 即可,表示重复字符的下一个字符开始计算
代码如下:
class Solution:
def lengthOfLongestSubstring(self, s: str) -> int:
length = len(s)
if length == 0:
return 0
i, j, ans = 0,0,0
char_dic = {}
while i < length and j < length:
if s[j] in char_dic:
i = max(char_dic[s[j]] + 1, i)
ans = max(j - i + 1, ans)
char_dic[s[j]] = j
j += 1
return ans
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problemset/all/