当前位置: 首页 > news >正文

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串(32_30_C++_困难)(滑动窗口:控制起点和滑动距离)

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串(32_30_C++_困难)

    • 题目描述:
    • 输入输出样例:
    • 题解:
      • 解题思路:
        • 思路一(滑动窗口(暴力)):
        • 思路二(滑动窗口(控制起点和滑动距离)):
      • 代码实现
        • 代码实现(思路一(滑动窗口(暴力))):
        • 代码实现(思路二(滑动窗口(控制起点和滑动距离))):
        • 以思路一为例进行调试

题目描述:

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同

s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如,如果 words = [“ab”,“cd”,“ef”], 那么 “abcdef”, “abefcd”,“cdabef”, “cdefab”,“efabcd”, 和 “efcdab” 都是串联子串。 “acdbef” 不是串联子串,因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

输入输出样例:

示例 1:
输入:s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出:[0,9]
解释:因为 words.length== 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 “barfoo” 开始位置是 0。它是 words 中以 [“bar”,“foo”] 顺序排列的连接。
子串 “foobar” 开始位置是 9。它是 words 中以 [“foo”,“bar”] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:
输入:s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出:[]
解释:因为 words.length== 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3:
输入:s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出:[6,9,12]
解释:因为 words.length== 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
子串 “foobarthe” 开始位置是 6。它是 words 中以 [“foo”,“bar”,“the”] 顺序排列的连接。
子串 “barthefoo” 开始位置是 9。它是 words 中以 [“bar”,“the”,“foo”] 顺序排列的连接。
子串 “thefoobar” 开始位置是 12。它是 words 中以 [“the”,“foo”,“bar”] 顺序排列的连接。

提示:
1 <= s.length <= 104
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

题解:

解题思路:

思路一(滑动窗口(暴力)):

1、具体思想为,将 s 的字符串与 words 中的字符串进行匹配,每次移动一个位置,如:第一次判断"[barfoo]thefoobarman",第二次判断"b[arfoot]hefoobarman"。因涉及到匹配问题可以很快想到使用哈希表存储 words 中的字符串。
① 首先创建一个哈希表(words_map)存储word中字符出现的次数 ,key=word[i] (string类型) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数,创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
:s = “barfoothefoobarman”, words = [“foo”,“bar”]

  • words_map={“foo”:1,“bar”:1} (注意这里匹配的是words_map和window_map中
    相同字符串出现的次数是否相同)
  • “[barfoo]thefoobarman”,统计统计窗口中匹配字符串的个数,window_map={“foo”:1,“bar”:1}==words_map(匹配)
  • “b[arfoot]hefoobarman”,统计统计窗口中匹配字符串的个数,window_map={“foo”:0,“bar”:0}!=words_map(不匹配)
  • “barfoothefoo[barman]”,统计统计窗口中匹配字符串的个数(不匹配),window_map={“foo”:0,“bar”:1}!=words_map(不匹配)

此算法的时间复杂度会超时,因每一次移动窗口时只移动一位字符,每次需重新统计窗口中匹配字符串的个数

2、复杂度分析:
① 时间复杂度:O(ls×n×m),其中 ls 是输入 s 的长度,n 是 words 中每个单词的长度,其中 m 是 words 的单词数。最坏情况 每移动一位字符需对 word中所有单词进行匹配。
② 空间复杂度:O(m×n),其中 m 是 words 的单词数,n 是 words 中每个单词的长度。统计words中单词词频的消耗,和每次滑动窗口时,需要用一个哈希表保存单词频次。

思路二(滑动窗口(控制起点和滑动距离)):

1、此方法每次移动 word 中一个字符串的长度进行匹配,跳过了重复匹配的情况。
① 创建一个哈希表(words_map)存储word中字符出现的次数 ,key=word[i] (string) value= word[i]在 word中出现的次数。
② 从左往右控制滑动窗口的大小为 words中字符的个数,创建一个哈希表(window_map)统计滑动窗口中与 word 中相同的字符串个数。
:s = “barfoothefoobarman”, words = [“foo”,“bar”]
words_map={“foo”:1,“bar”:1}

  • 起点从 i=0 下标开始
  • “[bar]foothefoobarman”,window_map={“foo”:1,“bar”:0}!=words_map(匹配个数为1)(注意这里的匹配个数指的是匹配字符串出现的次数)
  • “[barfoo]thefoobarman”,window_map={“foo”:1,“bar”:1}==words_map(匹配个数为2),统计下标
  • “bar[foothe]foobarman”,"the"不存在words_map中,将窗口移动到"the"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothe[foo]barman”,,window_map={“foo”:1,“bar”:0}!=words_map(匹配个数为1)
  • “barfoothefoo[barman]”,window_map={“foo”:0,“bar”:1}!=words_map(匹配个数为1)
  • 起点从 i=1 下标开始
  • “b[arf]oothefoobarman”,"arf"不存在words_map中,将窗口移动到"arf"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barf[oot]hefoobarman”,"oot"不存在words_map中,将窗口移动到"oot"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoot[hef]oobarman”,"hef"不存在words_map中,将窗口移动到"hef"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothefoob[arm]an”,"arm"不存在words_map中,将窗口移动到"arm"的右侧,清空window_map={“foo”:0,“bar”:0}
  • 起点从 i=2 下标开始
  • “ba[rfo]othefoobarman”,"rfo"不存在words_map中,将窗口移动到"rfo"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfo[oth]efoobarman”,"oth"不存在words_map中,将窗口移动到"oth"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfooth[efo]obarman”,"efo"不存在words_map中,将窗口移动到"efo"的右侧,清空window_map={“foo”:0,“bar”:0}
  • “barfoothefooba[rma]n”,"rma"不存在words_map中,将窗口移动到"rma"的右侧,清空window_map={“foo”:0,“bar”:0}

解决了方法一中字符串重复匹配的问题。

2、复杂度分析
① 时间复杂度:O(ls×n),其中 ls 是输入 s 的长度,n 是 words 中每个单词的长度。需要做 n 次滑动窗口,每次需要遍历一次 s。
② 空间复杂度:O(m×n),其中 m 是 words 的单词数,n 是 words 中每个单词的长度。统计words中单词词频的消耗,和每次滑动窗口时,需要用一个哈希表保存单词频次。

代码实现

代码实现(思路一(滑动窗口(暴力))):
class Solution1 {
public:// 主函数,寻找所有符合条件的子串vector<int> findSubstring(string s, vector<string>& words) {// 获取单词的长度和单词的数量int word_len = words[0].size();  // 每个单词的长度int word_count = words.size();   // 单词的数量int allWords_len = word_count * word_len; // 所有单词的总长度(即匹配的子串长度)vector<int> ans; // 用于存储匹配的起始位置// 如果字符串的长度小于所有单词总长度,则无法匹配,直接返回空结果if (s.size() < allWords_len) {return ans;}// 创建一个哈希表,用于记录每个单词出现的频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;  // 统计每个单词在words中出现的次数}int left = 0; // 左指针,表示当前窗口的起始位置// 从右边开始遍历字符串,每次遍历的右边界是从第一个单词后开始for (int right = words.size() - 1; right < s.size(); right++) {int match = 0;  // 记录匹配的单词数量unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数// 遍历窗口中的每个单词,尝试匹配所有单词for (int i = 0; i < word_count; i++) {// 获取当前窗口的单词(每个单词的长度是word_len)string tmp_str = s.substr(left + word_len * i, word_len);// 如果当前单词不在 words_map 中,则跳出循环if (!words_map.count(tmp_str)) {break;}// 更新当前窗口中的单词频率window_map[tmp_str]++;// 如果当前窗口中的单词与原始单词频率匹配,则增加match计数if (window_map[tmp_str] == words_map[tmp_str]) {match++;}// 如果当前单词的频率超过了words_map中的频率,说明有多余的单词,跳出循环if (window_map[tmp_str] > words_map[tmp_str]) {match--;break;}}// 如果match等于words_map中的单词数量,说明所有单词都已匹配if (match == words_map.size()) {ans.push_back(left);  // 将当前的起始位置添加到答案中}// 每次滑动窗口时,左指针右移left++;}// 返回所有符合条件的起始位置return ans;}
};
代码实现(思路二(滑动窗口(控制起点和滑动距离))):
class Solution2 {
public:vector<int> findSubstring(string s, vector<string>& words) {int word_len = words[0].size();int word_count = words.size();int allWords_len = word_count * word_len;vector<int> ans;// 如果总长度小于子串长度,直接返回if (s.size() < allWords_len) return ans;// 计算单词频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;}// 滑动窗口for (int i = 0; i < word_len; i++) {  // i 是偏移量,扫描每个可能的开始位置int left = i;int right = i;int match_count = 0;unordered_map<string, int> window_map;while (right + word_len <= s.size()) {string word = s.substr(right, word_len);right += word_len;// 如果当前单词是我们要找的词if (words_map.count(word)) {window_map[word]++;match_count++;// 如果某个单词出现次数超出预期,缩小窗口while (window_map[word] > words_map[word]) {string left_word = s.substr(left, word_len);window_map[left_word]--;match_count--;left += word_len;}// 如果所有单词匹配,记录结果if (match_count == word_count) {ans.push_back(left);}} else {// 如果当前单词不在字典中,重置窗口window_map.clear();match_count = 0;left = right;}}}return ans;}
};
以思路一为例进行调试
#include<iostream>
#include<unordered_map>
#include<vector>
using namespace std;class Solution1 {
public:// 主函数,寻找所有符合条件的子串vector<int> findSubstring(string s, vector<string>& words) {// 获取单词的长度和单词的数量int word_len = words[0].size();  // 每个单词的长度int word_count = words.size();   // 单词的数量int allWords_len = word_count * word_len; // 所有单词的总长度(即匹配的子串长度)vector<int> ans; // 用于存储匹配的起始位置// 如果字符串的长度小于所有单词总长度,则无法匹配,直接返回空结果if (s.size() < allWords_len) {return ans;}// 创建一个哈希表,用于记录每个单词出现的频率unordered_map<string, int> words_map;for (const auto &word : words) {words_map[word]++;  // 统计每个单词在words中出现的次数}int left = 0; // 左指针,表示当前窗口的起始位置// 从右边开始遍历字符串,每次遍历的右边界是从第一个单词后开始for (int right = words.size() - 1; right < s.size(); right++) {int match = 0;  // 记录匹配的单词数量unordered_map<string, int> window_map;  // 当前窗口中每个单词的计数// 遍历窗口中的每个单词,尝试匹配所有单词for (int i = 0; i < word_count; i++) {// 获取当前窗口的单词(每个单词的长度是word_len)string tmp_str = s.substr(left + word_len * i, word_len);// 如果当前单词不在 words_map 中,则跳出循环if (!words_map.count(tmp_str)) {break;}// 更新当前窗口中的单词频率window_map[tmp_str]++;// 如果当前窗口中的单词与原始单词频率匹配,则增加match计数if (window_map[tmp_str] == words_map[tmp_str]) {match++;}// 如果当前单词的频率超过了words_map中的频率,说明有多余的单词,跳出循环if (window_map[tmp_str] > words_map[tmp_str]) {match--;break;}}// 如果match等于words_map中的单词数量,说明所有单词都已匹配if (match == words_map.size()) {ans.push_back(left);  // 将当前的起始位置添加到答案中}// 每次滑动窗口时,左指针右移left++;}// 返回所有符合条件的起始位置return ans;}
};int main(int argc, char const *argv[])
{string s="barfoothefoobarma";vector<string> words={"foo","bar"};Solution1 s1;vector<int> ans= s1.findSubstring(s,words);for (auto &i : ans){cout<<i<<" ";}return 0;
}

LeetCode 面试经典 150_滑动窗口_串联所有单词的子串(32_30)原题链接
欢迎大家和我沟通交流(✿◠‿◠)

http://www.dtcms.com/a/361511.html

相关文章:

  • 原位表征技术在水系电池研究稳定性测试中的应用-测试GO
  • 教育 AI 的下半场:个性化学习路径生成背后,技术如何平衡效率与教育本质?
  • 学习日记-spring-day47-9.1
  • 使用LoadBalancer替换Ribbon(五)
  • 深入解析quiche开源项目:从QUIC协议到云原生实践
  • 每日算法题【二叉树】:计算二叉树节点的个数、叶子结点的个数、第k层节点的个数
  • 【面试场景题】不使用redis、zk如何自己开发一个分布式锁
  • 数据库索引失效的原因+示例
  • 视觉引导机械手双夹爪抓取:偏心旋转补偿与逆运动学求解
  • 卷积神经网络训练全攻略:从理论到实战
  • 【K8s】整体认识K8s之Configmap、Secret/ResourceQuota资源配额/访问控制
  • HTTP/2 多路复用
  • [C语言] 结构体 内存对齐规则 内存大小计算
  • 基于springboot生鲜交易系统源码和论文
  • 一文读懂k8s的pv与pvc原理
  • 威科夫与高频因子
  • 2.充分条件与必要条件
  • Android Framework打电话禁止播放运营商视频彩铃
  • Coze源码分析-工作空间-资源库-前端源码
  • Frida Hook 算法
  • 音频数据集采样率选择建议
  • 从网络层接入控制过渡到应用层身份认证的过程
  • 电源相关零碎知识总结
  • 如何把指定阿里云文件夹下的所有文件移动到另一个文件夹下,移动文件时把文件名称(不包括文件后缀)进行md5编码
  • @Autowired注入底层原理
  • 吴恩达机器学习补充:决策树和随机森林
  • AUTOSAR AP R24-11 Log and Trace 文档总结
  • 贪心算法解决钱币找零问题(二)
  • CentOS10安装RabbitMQ
  • [特殊字符]【C语言】超全C语言字符串处理函数指南:从原理到实战