当前位置：首页 > news >正文

python力扣3：无重复字符的最长子串

news 2025/10/8 13:26:06

给定一个字符串 s ，请你找出其中不含有重复字符的最长子串的长度。

示例 1:
输入: s = “abcabcbb”
输出: 3
解释: 因为无重复字符的最长子串是 “abc”，所以其长度为 3。

示例 2:
输入: s = “bbbbb”
输出: 1
解释: 因为无重复字符的最长子串是 “b”，所以其长度为 1。

示例 3:
输入: s = “pwwkew”
输出: 3
解释: 因为无重复字符的最长子串是 “wke”，所以其长度为 3。

请注意，你的答案必须是子串的长度，“pwke” 是一个子序列，不是子串。

提示：

0 <= s.length <= 5 * 104
s 由英文字母、数字、符号和空格组成

看到这个题目，我最先想到的是python中set（集合）是储存不重复元素的数据结构。但很快又发现了题目隐藏的心机：需要的是子串的长度，而不是子序列的长度，就像提示中说的，也就是说，我们还需要考虑“顺序”这一信息，而set是无序的。
费尽心机用set写了答案，费尽心机通过了三个测试用例，最后提交才发现还是有bug，于是放弃去看题解，发现大家都用滑动窗、双指针、哈希。
在这里插入图片描述
于是在参考了几个答案之后，有了这份答案：

class Solution(object):
    def lengthOfLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        max_len = cur_len = left = 0
        check = set()
        for i in range(len(s)):
            cur_len += 1
            while s[i] in check:
                check.remove(s[left])
                left += 1
                cur_len -= 1
            if cur_len > max_len : max_len = cur_len
            check.add(s[i])
        return max_len

在代码的循环中一共有四个部分：
1.当前长度+1
2.判断重复元素，将集合中左边元素移除
3.判断最大长度和当前长度关系，储存最大长度。
4.在集合中添加新元素。

需要注意的是：这四部分的顺序十分重要。
1：这部分应该在循环的最开始执行。因为每次循环都代表尝试将一个新的字符加入子串，所以需要先假设这个字符是有效的，然后后续逻辑再判断是否需要调整。它是基于“乐观假设”的第一步，后续部分需要验证这个假设是否成立。如果发现有重复字符，后续逻辑会调整长度。
2：这部分必须紧跟在“当前长度+1”之后。因为一旦发现重复字符，就需要调整子串的左边界，同时更新当前长度。它依赖于“当前长度+1”部分的假设，因为只有在尝试加入新字符后，才可能发现重复。它会直接影响“当前长度”，因为移除左侧字符会导致子串长度减小。它为后续的“添加新元素”部分铺平道路，确保集合中没有重复字符。
3：这部分应该在“判断重复元素”之后执行。因为只有在确保当前子串没有重复字符后，才能确定当前长度是否有效。它依赖于“判断重复元素”部分的结果，因为只有在移除重复字符后，当前子串才是有效的。它是整个算法的核心目标，即找到最长的无重复子串。
4：这部分应该在“判断重复元素”之后执行。因为只有在移除重复字符后，才能安全地真正将当前字符加入集合。它同样依赖于“判断重复元素”部分的结果，因为只有在移除重复字符后，集合中才没有重复元素。它为下一次循环的“当前长度+1”部分提供基础，即集合中已经包含当前字符。

同时需要注意：
判断是否在集合内的，和加入的都是s[i]（新元素），remove的是s[left]（列头元素）

查看全文

http://www.dtcms.com/a/50995.html