当前位置：首页 > news >正文

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串（32_30_C++_困难）(滑动窗口：控制起点和滑动距离)

news 2025/9/2 8:06:02

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串（32_30_C++_困难）

- 题目描述：
- 输入输出样例：
- 题解：
- - 解题思路：
  - - 思路一（滑动窗口(暴力)）：
    - 思路二（滑动窗口(控制起点和滑动距离)）：
  - 代码实现
  - - 代码实现（思路一（滑动窗口(暴力)））：
    - 代码实现（思路二（滑动窗口(控制起点和滑动距离)））：
    - 以思路一为例进行调试

题目描述：

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。

s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如，如果 words = [“ab”,“cd”,“ef”]，那么 “abcdef”， “abefcd”，“cdabef”， “cdefab”，“efabcd”，和 “efcdab” 都是串联子串。 “acdbef” 不是串联子串，因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

输入输出样例：

示例 1：
输入：s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出：[0,9]
解释：因为 words.length== 2 同时 words[i].length == 3，连接的子字符串的长度必须为 6。
子串 “barfoo” 开始位置是 0。它是 words 中以 [“bar”,“foo”] 顺序排列的连接。
子串 “foobar” 开始位置是 9。它是 words 中以 [“foo”,“bar”] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2：
输入：s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出：[]
解释：因为 words.length== 4 并且 words[i].length == 4，所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3：
输入：s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出：[6,9,12]
解释：因为 words.length== 3 并且 words[i].length == 3，所以串联子串的长度必须为 9。
子串 “foobarthe” 开始位置是 6。它是 words 中以 [“foo”,“bar”,“the”] 顺序排列的连接。
子串 “barthefoo” 开始位置是 9。它是 words 中以 [“bar”,“the”,“foo”] 顺序排列的连接。
子串 “thefoobar” 开始位置是 12。它是 words 中以 [“the”,“foo”,“bar”] 顺序排列的连接。

提示：
1 <= s.length <= 10⁴
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

题解：

解题思路：

思路一（滑动窗口(暴力)）：

1、具体思想为，将 s 的字符串与 words 中的字符串进行匹配，每次移动一个位置，如：第一次判断"[barfoo]thefoobarman"，第二次判断"b[arfoot]hefoobarman"。因涉及到匹配问题可以很快想到使用哈希表存储 words 中的字符串。
① 首先创建一个哈希表(words_map)存储word中字符出现的次数，key=word[i] (string类型) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数，创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
例：s = “barfoothefoobarman”, words = [“foo”,“bar”]

words_map={“foo”:1,“bar”:1} （注意这里匹配的是words_map和window_map中
相同字符串出现的次数是否相同）
“[barfoo]thefoobarman”，统计统计窗口中匹配字符串的个数，window_map={“foo”:1,“bar”:1}==words_map（匹配）
“b[arfoot]hefoobarman”，统计统计窗口中匹配字符串的个数，window_map={“foo”:0,“bar”:0}!=words_map（不匹配）
…
…
“barfoothefoo[barman]”，统计统计窗口中匹配字符串的个数（不匹配）,window_map={“foo”:0,“bar”:1}!=words_map（不匹配）

此算法的时间复杂度会超时，因每一次移动窗口时只移动一位字符，每次需重新统计窗口中匹配字符串的个数

2、复杂度分析：
① 时间复杂度：O(ls×n×m)，其中 ls 是输入 s 的长度，n 是 words 中每个单词的长度，其中 m 是 words 的单词数。最坏情况每移动一位字符需对 word中所有单词进行匹配。
② 空间复杂度：O(m×n)，其中 m 是 words 的单词数，n 是 words 中每个单词的长度。统计words中单词词频的消耗，和每次滑动窗口时，需要用一个哈希表保存单词频次。

思路二（滑动窗口(控制起点和滑动距离)）：

1、此方法每次移动 word 中一个字符串的长度进行匹配，跳过了重复匹配的情况。
① 创建一个哈希表(words_map)存储word中字符出现的次数，key=word[i] (string) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数，创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
例：s = “barfoothefoobarman”, words = [“foo”,“bar”]
words_map={“foo”:1,“bar”:1}

起点从 i=0 下标开始
“[bar]foothefoobarman”，window_map={“foo”:1,“bar”:0}!=words_map（匹配个数为1）(注意这里的匹配个数指的是匹配字符串出现的次数)
“[barfoo]thefoobarman”，window_map={“foo”:1,“bar”:1}==words_map（匹配个数为2）,统计下标
“bar[foothe]foobarman”，"the"不存在words_map中,将窗口移动到"the"的右侧，清空window_map={“foo”:0,“bar”:0}
“barfoothe[foo]barman”，，window_map={“foo”:1,“bar”:0}!=words_map（匹配个数为1）
…
…
“barfoothefoo[barman]”，window_map={“foo”:0,“bar”:1}!=words_map（匹配个数为1）
起点从 i=1 下标开始
“b[arf]oothefoobarman”，"arf"不存在words_map中,将窗口移动到"arf"的右侧，清空window_map={“foo”:0,“bar”:0}
“barf[oot]hefoobarman”，"oot"不存在words_map中,将窗口移动到"oot"的右侧，清空window_map={“foo”:0,“bar”:0}
“barfoot[hef]oobarman”，"hef"不存在words_map中,将窗口移动到"hef"的右侧，清空window_map={“foo”:0,“bar”:0}
…
…
“barfoothefoob[arm]an”，"arm"不存在words_map中,将窗口移动到"arm"的右侧，清空window_map={“foo”:0,“bar”:0}
起点从 i=2 下标开始
“ba[rfo]othefoobarman”，"rfo"不存在words_map中,将窗口移动到"rfo"的右侧，清空window_map={“foo”:0,“bar”:0}
“barfo[oth]efoobarman”，"oth"不存在words_map中,将窗口移动到"oth"的右侧，清空window_map={“foo”:0,“bar”:0}
“barfooth[efo]obarman”，"efo"不存在words_map中,将窗口移动到"efo"的右侧，清空window_map={“foo”:0,“bar”:0}
…
…
“barfoothefooba[rma]n”，"rma"不存在words_map中,将窗口移动到"rma"的右侧，清空window_map={“foo”:0,“bar”:0}

解决了方法一中字符串重复匹配的问题。

2、复杂度分析
① 时间复杂度：O(ls×n)，其中 ls 是输入 s 的长度，n 是 words 中每个单词的长度。需要做 n 次滑动窗口，每次需要遍历一次 s。
② 空间复杂度：O(m×n)，其中 m 是 words 的单词数，n 是 words 中每个单词的长度。统计words中单词词频的消耗，和每次滑动窗口时，需要用一个哈希表保存单词频次。

代码实现

代码实现（思路一（滑动窗口(暴力)））：

class Solution1 {
public:// 主函数，寻找所有符合条件的子串vector<int> findSubstring(string s, vector<string>& words) {// 获取单词的长度和单词的数量int word_len = words[0].size();  // 每个单词的长度int word_count = words.size();   // 单词的数量int allWords_len = word_count * word_len; // 所有单词的总长度（即匹配的子串长度）vector<int> ans; // 用于存储匹配的起始位置// 如果字符串的长度小于所有单词总长度，则无法匹配，直接返回空结果if (s.size() < allWords_len) {return ans;}// 创建一个哈希表，用于记录每个单词出现的频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;  // 统计每个单词在words中出现的次数}int left = 0; // 左指针，表示当前窗口的起始位置// 从右边开始遍历字符串，每次遍历的右边界是从第一个单词后开始for (int right = words.size() - 1; right < s.size(); right++) {int match = 0;  // 记录匹配的单词数量unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数// 遍历窗口中的每个单词，尝试匹配所有单词for (int i = 0; i < word_count; i++) {// 获取当前窗口的单词（每个单词的长度是word_len）string tmp_str = s.substr(left + word_len * i, word_len);// 如果当前单词不在 words_map 中，则跳出循环if (!words_map.count(tmp_str)) {break;}// 更新当前窗口中的单词频率window_map[tmp_str]++;// 如果当前窗口中的单词与原始单词频率匹配，则增加match计数if (window_map[tmp_str] == words_map[tmp_str]) {match++;}// 如果当前单词的频率超过了words_map中的频率，说明有多余的单词，跳出循环if (window_map[tmp_str] > words_map[tmp_str]) {match--;break;}}// 如果match等于words_map中的单词数量，说明所有单词都已匹配if (match == words_map.size()) {ans.push_back(left);  // 将当前的起始位置添加到答案中}// 每次滑动窗口时，左指针右移left++;}// 返回所有符合条件的起始位置return ans;}
};

代码实现（思路二（滑动窗口(控制起点和滑动距离)））：

class Solution2 {
public:vector<int> findSubstring(string s, vector<string>& words) {int word_len = words[0].size();int word_count = words.size();int allWords_len = word_count * word_len;vector<int> ans;// 如果总长度小于子串长度，直接返回if (s.size() < allWords_len) return ans;// 计算单词频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;}// 滑动窗口for (int i = 0; i < word_len; i++) {  // i 是偏移量，扫描每个可能的开始位置int left = i;int right = i;int match_count = 0;unordered_map<string, int> window_map;while (right + word_len <= s.size()) {string word = s.substr(right, word_len);right += word_len;// 如果当前单词是我们要找的词if (words_map.count(word)) {window_map[word]++;match_count++;// 如果某个单词出现次数超出预期，缩小窗口while (window_map[word] > words_map[word]) {string left_word = s.substr(left, word_len);window_map[left_word]--;match_count--;left += word_len;}// 如果所有单词匹配，记录结果if (match_count == word_count) {ans.push_back(left);}} else {// 如果当前单词不在字典中，重置窗口window_map.clear();match_count = 0;left = right;}}}return ans;}
};

以思路一为例进行调试

#include<iostream>
#include<unordered_map>
#include<vector>
using namespace std;class Solution1 {
public:// 主函数，寻找所有符合条件的子串vector<int> findSubstring(string s, vector<string>& words) {// 获取单词的长度和单词的数量int word_len = words[0].size();  // 每个单词的长度int word_count = words.size();   // 单词的数量int allWords_len = word_count * word_len; // 所有单词的总长度（即匹配的子串长度）vector<int> ans; // 用于存储匹配的起始位置// 如果字符串的长度小于所有单词总长度，则无法匹配，直接返回空结果if (s.size() < allWords_len) {return ans;}// 创建一个哈希表，用于记录每个单词出现的频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;  // 统计每个单词在words中出现的次数}int left = 0; // 左指针，表示当前窗口的起始位置// 从右边开始遍历字符串，每次遍历的右边界是从第一个单词后开始for (int right = words.size() - 1; right < s.size(); right++) {int match = 0;  // 记录匹配的单词数量unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数// 遍历窗口中的每个单词，尝试匹配所有单词for (int i = 0; i < word_count; i++) {// 获取当前窗口的单词（每个单词的长度是word_len）string tmp_str = s.substr(left + word_len * i, word_len);// 如果当前单词不在 words_map 中，则跳出循环if (!words_map.count(tmp_str)) {break;}// 更新当前窗口中的单词频率window_map[tmp_str]++;// 如果当前窗口中的单词与原始单词频率匹配，则增加match计数if (window_map[tmp_str] == words_map[tmp_str]) {match++;}// 如果当前单词的频率超过了words_map中的频率，说明有多余的单词，跳出循环if (window_map[tmp_str] > words_map[tmp_str]) {match--;break;}}// 如果match等于words_map中的单词数量，说明所有单词都已匹配if (match == words_map.size()) {ans.push_back(left);  // 将当前的起始位置添加到答案中}// 每次滑动窗口时，左指针右移left++;}// 返回所有符合条件的起始位置return ans;}
};int main(int argc, char const *argv[])
{string s="barfoothefoobarma";vector<string> words={"foo","bar"};Solution1 s1;vector<int> ans= s1.findSubstring(s,words);for (auto &i : ans){cout<<i<<" ";}return 0;
}