当前位置: 首页 > news >正文

浅谈 ST 表(Sparse Table,稀疏表)

前置知识

如何快速求出 ⌊ log ⁡ 2 x ⌋ \lfloor\log_2x\rfloor log2x

这里有几种方法。

  • O ( n ) \mathcal O(n) O(n) 打表,在 ST 表的应用中只需要打数字数量级别的表就行。
  • 使用不可移植的 GCC 内部函数。
  • 标准做法是使用 C++20 的 bit_width 函数再 − 1 -1 1,注意目前 NOI 系列比赛不能用。
  • O ( log ⁡ log ⁡ n ) \mathcal O(\log \log n) O(loglogn) 的倍增做法。

四种方法的代码见下。

enum class qwq123_mode
{GetTable,GCCInnerFunc,BitWidth,Binary,Default = Binary // 此处 Binary 可以换成上面的任意一个值
};
constexpr int value_range = 100005; // 值域(用于打表)
unsigned qwq123(unsigned x)
{switch(qwq123_mode::Default){case qwq123_mode::GetTable:// 定义表类型,原因见下class TableType{int* table;public:TableType(){table = new int[value_range + 1];table[1] = 0;for (int i = 2; i <= value_range; i++){table[i] = table[i >> 1] + 1;}}int get(int x) { return table[x]; }};// 使用语法糖实现自动打表// 利用 static 变量第一次声明自动初始化static TableType tt;return tt.get(x);case qwq123_mode::GCCInnerFunc: return 31 - __builtin_clz(x);case qwq123_mode::BitWidth: return bit_width(x) - 1;case qwq123_mode::Binary: // 通常来讲,unsigned 比 int 快// 前提是不开编译器优化。聪明一点的编译器// 都会把可以用 unsigned 的 int// 替换成 unsigned。unsigned res = 0;// 事实上,应该是 res += 16// 但是其实两者等价。不开编译器优化时// |= 明显更快。if (x >> 16) { res |= 16; x >>= 16; }if (x >> 8) { res |= 8; x >>= 8; }if (x >> 4) { res |= 4; x >>= 4; }if (x >> 2) { res |= 2; x >>= 2; }// 最后不需要调整 x 了。if (x >> 1) { res |= 1; }return res;}
}

下面是测速结果。

意料之中地,GCC 内部函数做法最快,标准做法其次。

算法介绍

ST 表(又名稀疏表,Sparse Table),是一种支持静态 RMQ 问题的数据结构。

什么是 RMQ 问题?是 Range Maximum/Minimum Query 的缩写,表示区间最值。其实,ST 表不仅可以处理 RMQ 问题,还可以处理所有满足可重复贡献且满足结合律的问题(没错,这一段就是从 OI-wiki 上抄的)。设操作为 f ( x , y ) f(x,y) f(x,y),可重复贡献是指 f ( x , x ) = x f(x,x)=x f(x,x)=x,而满足结合律是指 f ( x , f ( y , z ) ) = f ( f ( x , y ) , z ) f(x,f(y,z))=f(f(x,y),z) f(x,f(y,z))=f(f(x,y),z)下面我们都假设操作为 max ⁡ \bm{\max} max 操作。

它其实是一个二维数组。通常情况下,我们使用 f i , j f_{i,j} fi,j 表示 max ⁡ k = i i + 2 j − 1 a k \displaystyle\max_{k=i}^{i+2^j-1}a_k k=imaxi+2j1ak,但是事实证明这种表示方法并不是很好。

为什么?第一个原因是因为 cache 不友好,为啥不友好详见后面的预处理部分。第二个原因是因为作者常写的边度边预处理在这种表示法下不好写也不好看,作者习惯的是 f j , i = max ⁡ k = i − 2 j + 1 i a k \displaystyle f_{j,i}=\max_{k=i-2^j+1}^{i}a_k fj,i=k=i2j+1maxiak以下都用这种表示方法。

测速结果(均使用 GCC 内置函数算 log ⁡ \log log):

预处理

显然是递推。

我们注意到区间 [ x , x + 2 j ) [x, x+2^j) [x,x+2j) 可以分为两部分, [ x , x + 2 j − 1 ) [x,x+2^{j-1}) [x,x+2j1) [ x + 2 j − 1 , x + 2 j ) [x+2^{j-1},x+2^j) [x+2j1,x+2j)(看过我的线段树文章的估计对这个东西比较熟悉)。递推即可。递推式为 f i , j = max ⁡ ( f i − 1 , j , f i − 1 , j − 2 i − 1 ) f_{i,j}=\max(f_{i-1,j},f_{i-1,j-2^{i-1}}) fi,j=max(fi1,j,fi1,j2i1),时间复杂度显然是 O ( n log ⁡ n ) \mathcal O(n \log n) O(nlogn),显然这个递推式是时间复杂度上最优的。

我们发现一件事情:转移顺序?

显然第一维从 i i i 还是 j j j 开始转移都没毛病。然而,显然先枚举 j j j 的做法难以处理“在 ST 表之后添加数字”,而先枚举 i i i 可以,所以通常情况下我们先枚举 j j j

查询

现在可重复贡献的优势就来了。

x , y x,y x,y 是两个集合,则显然 max ⁡ ( max ⁡ i ∈ x i , max ⁡ i ∈ y i ) = max ⁡ i ∈ x ∪ y i \displaystyle\max\left(\max_{i \in x} i,\max_{i\in y}i\right)=\max_{i \in x \cup y}i max(ixmaxi,iymaxi)=ixymaxi

那么如果 x ∪ y = [ a , b ] x \cup y = [a,b] xy=[a,b],那么取 k = 2 log ⁡ ( b − a + 1 ) k=2^{\log(b-a+1)} k=2log(ba+1),构造 x = [ a , a + 2 k − 1 ] x=[a,a+2^k-1] x=[a,a+2k1] y = [ b − 2 k + 1 , b ] y=[b-2^k+1,b] y=[b2k+1,b],容易发现满足条件,且都可以使用 ST 表中的元素表示。时间复杂度取决于 k k k 的计算复杂度,通常视为 Θ ( 1 ) \Theta(1) Θ(1)

正确性证明

好好看文章。

已经在上面详细解释了。

代码实现

#include <bit>
#include <cstdio>
#include <algorithm>using namespace std;int a[100005], st[25][100005];
enum class qwq123_mode
{GetTable,GCCInnerFunc,BitWidth,Binary,Default = GCCInnerFunc
};
constexpr int value_range = 100005; // 值域
unsigned qwq123(unsigned x)
{switch(qwq123_mode::Default){case qwq123_mode::GetTable:// 定义表类型,原因见下class TableType{int* table;public:TableType(){table = new int[value_range + 1];table[1] = 0;for (int i = 2; i <= value_range; i++){table[i] = table[i >> 1] + 1;}}int get(int x) { return table[x]; }};// 使用语法糖实现自动打表// 利用 static 变量第一次声明自动初始化static TableType tt;return tt.get(x);case qwq123_mode::GCCInnerFunc: return 31 - __builtin_clz(x);case qwq123_mode::BitWidth: return bit_width(x) - 1;case qwq123_mode::Binary: // 通常来讲,unsigned 比 int 快// 前提是不开编译器优化。聪明一点的编译器// 都会把可以用 unsigned 的 int// 替换成 unsigned。unsigned res = 0;// 事实上,应该是 res += 16// 但是其实两者等价。不开编译器优化时// |= 明显更快。if (x >> 16) { res |= 16; x >>= 16; }if (x >> 8) { res |= 8; x >>= 8; }if (x >> 4) { res |= 4; x >>= 4; }if (x >> 2) { res |= 2; x >>= 2; }// 最后不需要调整 x 了。if (x >> 1) { res |= 1; }return res;}
}int main()
{int n, m;scanf("%d%d", &n, &m);for (int i = 1; i <= n; i++){scanf("%d", st[0] + i);for (int j = 1; (i - (1 << j)) >= 0; j++){st[j][i] = max(st[j - 1][i], st[j - 1][i - (1 << (j - 1))]);}}for (int i = 1; i <= m; i++){unsigned x, y;scanf("%u%u", &x, &y);unsigned len = y - x + 1, llen = qwq123(len), lllen = 1 << llen;printf("%d\n", max(st[llen][x + lllen - 1], st[llen][y]));}return 0;
}

record。

相关文章:

  • 规则与人性的天平——由高考迟到事件引发的思考
  • 从零手写Java版本的LSM Tree (六):WAL 写前日志
  • 从零手写Java版本的LSM Tree (七):压缩策略
  • 第二章:文本处理与表示的基础 —— 解码语言的奥秘
  • 运放——单电源供电和双电源供电
  • PyG测试GCN无线通信网络拓扑推理方法时间复杂度
  • Windows11+VS2019配置Libigl-2.4.1
  • Green Gold Label 绿金标认证
  • el-switch文字内置
  • 【Linux指南】用户与系统基础操作
  • 华为OD机试-最短木板长度-二分法(A卷,100分)
  • 【时时三省】(C语言基础)变量的存储方式和生存期
  • 医美宏脉软件如何通过快解析实现远程访问?
  • 【java】【服务器】线程上下文丢失 是指什么
  • 【51单片机】4. 模块化编程与LCD1602Debug
  • 2025最全TS手写题之partial/Omit/Pick/Exclude/Readonly/Required
  • STM32使用水位传感器
  • 牛客round95D
  • 科伦药业:以“三发引擎”驱动创新,全面迈入价值收获新周期
  • TCA 循环中间体如何改写肝损伤命运【AbMole】
  • 政府网站建设公司/网页开发
  • 泉州专业建站品牌/衡水seo营销
  • 网站开发源码/站长工具端口扫描
  • 网站建设新闻/西安网站建设制作
  • 专业的聊城做网站费用/semantic ui
  • 企业网站备案信息/网站设计开发网站