python力扣3:无重复字符的最长子串
给定一个字符串 s ,请你找出其中不含有重复字符的 最长 子串 的长度。
示例 1:
输入: s = “abcabcbb”
输出: 3
解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。
示例 2:
输入: s = “bbbbb”
输出: 1
解释: 因为无重复字符的最长子串是 “b”,所以其长度为 1。
示例 3:
输入: s = “pwwkew”
输出: 3
解释: 因为无重复字符的最长子串是 “wke”,所以其长度为 3。
请注意,你的答案必须是 子串 的长度,“pwke” 是一个子序列,不是子串。
提示:
0 <= s.length <= 5 * 104
s 由英文字母、数字、符号和空格组成
看到这个题目,我最先想到的是python中set(集合)是储存不重复元素的数据结构。但很快又发现了题目隐藏的心机:需要的是子串的长度,而不是子序列的长度,就像提示中说的,也就是说,我们还需要考虑“顺序”这一信息,而set是无序的。
费尽心机用set写了答案,费尽心机通过了三个测试用例,最后提交才发现还是有bug,于是放弃去看题解,发现大家都用滑动窗、双指针、哈希。
于是在参考了几个答案之后,有了这份答案:
class Solution(object):
def lengthOfLongestSubstring(self, s):
"""
:type s: str
:rtype: int
"""
max_len = cur_len = left = 0
check = set()
for i in range(len(s)):
cur_len += 1
while s[i] in check:
check.remove(s[left])
left += 1
cur_len -= 1
if cur_len > max_len : max_len = cur_len
check.add(s[i])
return max_len
在代码的循环中一共有四个部分:
1.当前长度+1
2.判断重复元素,将集合中左边元素移除
3.判断最大长度和当前长度关系,储存最大长度。
4.在集合中添加新元素。
需要注意的是:这四部分的顺序十分重要。
1:这部分应该在循环的最开始执行。因为每次循环都代表尝试将一个新的字符加入子串,所以需要先假设这个字符是有效的,然后后续逻辑再判断是否需要调整。它是基于“乐观假设”的第一步,后续部分需要验证这个假设是否成立。如果发现有重复字符,后续逻辑会调整长度。
2:这部分必须紧跟在“当前长度+1”之后。因为一旦发现重复字符,就需要调整子串的左边界,同时更新当前长度。它依赖于“当前长度+1”部分的假设,因为只有在尝试加入新字符后,才可能发现重复。它会直接影响“当前长度”,因为移除左侧字符会导致子串长度减小。它为后续的“添加新元素”部分铺平道路,确保集合中没有重复字符。
3:这部分应该在“判断重复元素”之后执行。因为只有在确保当前子串没有重复字符后,才能确定当前长度是否有效。它依赖于“判断重复元素”部分的结果,因为只有在移除重复字符后,当前子串才是有效的。它是整个算法的核心目标,即找到最长的无重复子串。
4:这部分应该在“判断重复元素”之后执行。因为只有在移除重复字符后,才能安全地真正将当前字符加入集合。它同样依赖于“判断重复元素”部分的结果,因为只有在移除重复字符后,集合中才没有重复元素。它为下一次循环的“当前长度+1”部分提供基础,即集合中已经包含当前字符。
同时需要注意:
判断是否在集合内的,和加入的都是s[i](新元素),remove的是s[left](列头元素)