当前位置：首页 > news >正文

字符串匹配之拓展 KMP算法(Z算法)

news 2025/10/31 17:54:05

文章目录

习题
- 2223.构造字符串的总得分和
- 3031.将单词恢复初始状态所需的最短时间 II

灵神代码模版

区别与KMP算法
- KMP算法可用于求解在线性时间复杂度0(n)内求解模式串p在主串s中匹配的未知
- 当然，由于在KMP算法中，预处理求解出了next数组，也就是可以求解出字符串p的真后缀与真前缀的最大公共前缀LCP，next[i]表示字符串p[0] 到 p[i] 的真前缀和真后缀的LCP
拓展KMP算法(Z函数)：
- 用于求解主串s的后缀与模式串p的LCP
- 当然，预处理过程中的z[i]可用于求解字符串p[i:] 与字符串p的LCP

下面给出求解Z数组的python 代码

# 计算并返回 z 数组，其中 z[i] = |LCP(s[i:], s)|
def calc_z(s: str) -> List[int]:n = len(s)z = [0] * n# box_l和box_r维护的是一个区间，# 也就是s[box_l:box_r+1]与s[box_r]匹配box_l = box_r = 0for i in range(1, n):# 当i在区间内，就可以利用先前的信息if i <= box_r:# 这个z[i-box_l] 十分巧妙z[i] = min(z[i - box_l], box_r - i + 1)while i + z[i] < n and s[z[i]] == s[i + z[i]]:box_l, box_r = i, i + z[i]z[i] += 1z[0] = nreturn z

重点分析为什么落在区间的时候，有z[i]=min(z[i - box_l],box_r - i + 1)
- 首先，对于i-box_l,是左边的情况，我们得时刻记得s[box_l:box_r+1]与s[box_r]匹配,所以，我们更加关注从s[i]开始的情况，也就是s[box_l]开始的情况，所以可以直接借鉴
- 对于box_r-i+1,是对于区间提供信息的长度限制，不能超过box_r-i+1，因为超过这个范围的信息没有记录

习题

2223.构造字符串的总得分和

在这里插入图片描述

思路分析：拓展kmp算法模版题目

class Solution:def sumScores(self, s: str) -> int:# 拓展kmp算法的模版题目n = len(s)z = [0]*n box_l,box_r =0,0for i in range(1,n):if i <= box_r:z[i] = min(z[i-box_l],box_r-i+1)while i + z[i] < n and s[z[i]] == s[i + z[i]]:box_l,box_r = i,i+z[i]z[i] += 1z[0] = n return sum(z)

3031.将单词恢复初始状态所需的最短时间 II

在这里插入图片描述

灵神题解

思路分析：我们需要考虑原始序列，与当前位置的后缀的最长公共前缀的长度关系，如果z[i]>=n-i，并且i%k==0,就说明可以通过i//k次就可以通过恢复原型，当然，如果遇到无法恢复的情况，我们至多 $\left\lceil\frac{n}{k}\right\rceil$ 次即可恢复

class Solution:def minimumTimeToInitialState(self, word: str, k: int) -> int:# 拓展kmp算法问题# 反正就是查看z[k]是否等于k ,一直找n = len(word)z = [0]*n box_l,box_r = 0,0for i in range(1,n):if i <= box_r:z[i] = min(z[i-box_l],box_r-i+1)while i + z[i] < n and word[z[i]] == word[i+z[i]]:box_l,box_r = i,i+z[i]z[i] += 1if i % k == 0 and z[i] >= n - i:return i // k# 如果复原不了，那也只是 n // k 的向上取整return  (n-1) // k + 1