当前位置: 首页 > news >正文

杜教筛原理,实现与时间复杂度分析

引例

洛谷 P4213 【模板】杜教筛

题目描述

给定一个正整数,求

a n s 1 = ∑ i = 1 n φ ( i ) ans_1=\sum_{i=1}^n\varphi(i) ans1=i=1nφ(i)

a n s 2 = ∑ i = 1 n μ ( i ) ans_2=\sum_{i=1}^n \mu(i) ans2=i=1nμ(i)

输入格式

本题单测试点内有多组数据

输入的第一行为一个整数,表示数据组数 T T T

接下来 T T T 行,每行一个整数 n n n,表示一组询问。

输出格式

对于每组询问,输出一行两个整数,分别代表 a n s 1 ans_1 ans1 a n s 2 ans_2 ans2

输入输出样例 #1

输入 #1

6
1
2
8
13
30
2333

输出 #1

1 1
2 0
22 -2
58 -3
278 -3
1655470 2

说明/提示

数据规模与约定

对于全部的测试点,保证 1 ≤ T ≤ 10 1 \leq T \leq 10 1T10 1 ≤ n < 2 31 1 \leq n \lt 2^{31} 1n<231。对于全部的测试点,保证 1 ≤ T ≤ 10 1 \leq T \leq 10 1T10 1 ≤ n < 2 31 1 \leq n \lt 2^{31} 1n<231

题中要求以低于线性的时间复杂度对数论函数求和。

原理

将例写为更一般的形式:

S ( n ) = ∑ i = 1 n f ( i ) S(n)=\sum_{i=1}^{n}f(i) S(n)=i=1nf(i) ,其中, f f f 是数论函数。

构造函数 g g g 并令 h = f ∗ g = g ∗ f h=f*g=g*f h=fg=gf
故,
∑ i = 1 n h ( i ) = ∑ i = 1 n ∑ d ∣ i g ( d ) f ( i d ) = ∑ d = 1 n ∑ d ∣ i n g ( d ) f ( i d ) = ∑ d = 1 n g ( d ) ∑ d ∣ i n f ( i d ) = ∑ d = 1 n g ( d ) ∑ i = 1 ⌊ n d ⌋ f ( i ) = ∑ d = 1 n g ( d ) S ( ⌊ n d ⌋ ) = g ( 1 ) S ( n ) + ∑ i = 2 n g ( i ) S ( ⌊ n i ⌋ ) \begin{aligned} \sum_{i=1}^nh(i) &= \sum_{i=1}^n\sum_{d|i}g(d)f\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^n\sum_{d|i}^ng(d)f\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^ng(d)\sum_{d|i}^nf\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^ng(d)\sum_{i=1}^{\left\lfloor \frac{n}{d}\right\rfloor}f(i) \\ &= \sum_{d=1}^ng(d)S\left(\left\lfloor \frac{n}{d}\right\rfloor\right) \\ &= g(1)S(n)+\sum_{i=2}^ng(i)S\left(\left\lfloor \frac{n}{i}\right\rfloor\right) \end{aligned} i=1nh(i)=i=1ndig(d)f(di)=d=1nding(d)f(di)=d=1ng(d)dinf(di)=d=1ng(d)i=1dnf(i)=d=1ng(d)S(dn)=g(1)S(n)+i=2ng(i)S(in)
因此,
g ( 1 ) S ( n ) = ∑ i = 1 n h ( i ) − ∑ i = 2 n g ( i ) S ( ⌊ n / i ⌋ ) g(1)S(n)=\sum_{i=1}^nh(i)-\sum_{i=2}^ng(i)S(\lfloor n/i\rfloor) g(1)S(n)=i=1nh(i)i=2ng(i)S(⌊n/i⌋)

采用数论分快加速第二个求和运算,这要求:

  • 可以快速计算 ∑ i = 1 n h ( i ) \sum_{i=1}^nh(i) i=1nh(i)
  • 可以快速计算 ∑ i = l r g ( i ) \sum_{i=l}^rg(i) i=lrg(i)

实现

实现时构造出来的 h , g h,g h,g 已经满足了上述要求,采用记忆化搜索计算 S ( n ) S(n) S(n) ,数论分块加速求和。
考虑进一步优化,对于前 k k k 项使用线性筛直接计算。
以下为C++参考实现。

时间复杂度分析

此处伪证极多,点名《算法竞赛》中的“高阶小量”伪证。

先考虑有哪些 S ( i ) S(i) S(i) 会被计算。
设记搜时 S ( i ) S(i) S(i) 会使用 R ( i ) = { j ∣ j = ⌊ i k ⌋ , k ∈ N + , k > 1 } R(i)=\{j|j=\lfloor \frac ik \rfloor,k∈\mathbb{N^+},k>1\} R(i)={jj=ki,kN+,k>1} 中的元素的 S S S

下证若 m ∈ R ( n ) m∈R(n) mR(n) ,则 R ( m ) ⊆ R ( n ) R(m)\subseteq R(n) R(m)R(n)
对于任意 i ∈ R ( m ) i∈R(m) iR(m) , i = ⌊ m x ⌋ i=\lfloor \frac mx \rfloor i=xm
m = ⌊ n y ⌋ m=\lfloor \frac ny \rfloor m=yn
i = ⌊ ⌊ n y ⌋ x ⌋ = ⌊ n x y ⌋ ∈ R ( n ) i=\lfloor \frac {\lfloor \frac ny \rfloor}x \rfloor =\lfloor \frac n{xy} \rfloor ∈R(n) i=xyn=xynR(n)

由上知只有 i ∈ R ( n ) i∈R(n) iR(n) 才会被计算。

下令 T ( n ) T(n) T(n) 为计算 S ( n ) S(n) S(n) 的时间复杂度,并忽略计算 h , g h,g h,g 相关的消耗。则由数论分块相关可知 T ( n ) = n T(n)=\sqrt n T(n)=n

类似数论分块,若 i = ⌊ n x ⌋ ∈ R ( n ) i=\lfloor \frac nx \rfloor∈R(n) i=xnR(n)
i ≤ n i≤\sqrt n in 或 $ i=\lfloor \frac nj \rfloor,j<\sqrt n$ 。

对于朴素的杜教筛(不使用线性筛优化),其时间复杂度为,
∑ i ∈ R ( n ) T ( i ) = ∑ i ∈ R ( n ) i = ∑ i = 1 ⌊ n ⌋ i + ∑ j = 2 ⌊ n ⌋ n j < ∑ i = 1 ⌊ n ⌋ i + n i ≈ ∫ 0 n ( x + n x ) d x = n 3 / 4 \begin{align} \sum_{i∈R(n)}T(i)&=\sum_{i∈R(n)}\sqrt i \\ &=\sum_{i=1}^{\left\lfloor \sqrt n \right\rfloor}\sqrt i + \sum_{j=2}^{\left\lfloor \sqrt n \right\rfloor}\sqrt{\frac nj} \\ &<\sum_{i=1}^{\left\lfloor \sqrt n \right\rfloor}\sqrt i +\sqrt{\frac ni} \\ &≈\int_0^{\sqrt n}(\sqrt x +\sqrt{\frac nx})dx \\ &=n^{3/4} \end{align} iR(n)T(i)=iR(n)i =i=1n i +j=2n jn i=1n i +in 0n (x +xn )dx=n3/4
即为 O ( n 3 / 4 ) O(n^{3/4}) O(n3/4)

若使用线性筛预处理前 k k k 项,预处理部分时间复杂度为 O ( k ) O(k) O(k) 。当 k > n k>\sqrt n k>n 时时间复杂度变为,
k + ∑ i ∈ R ( n ) , i > k T ( i ) = k + ∑ i ∈ R ( n ) , i > k i = k + ∑ j = 2 ⌊ n / k ⌋ n j < k + ∑ i = 1 ⌊ n / k ⌋ n i ≈ k + ∫ 0 n / k n x d x = k + n k \begin{aligned} k+\sum_{i\in R(n),i>k}T(i)&=k+\sum_{i\in R(n),i>k}\sqrt{i} \\ &=k+ \sum_{j=2}^{\lfloor n/k \rfloor}\sqrt{\frac{n}{j}} \\ &<k+\sum_{i=1}^{\lfloor n/k \rfloor}\sqrt{\frac{n}{i}} \\ &\approx k+\int_0^{n/k}\sqrt{\frac{n}{x}}dx \\ &=k+\frac{n}{\sqrt{k}} \end{aligned} k+iR(n),i>kT(i)=k+iR(n),i>ki =k+j=2n/kjn <k+i=1n/kin k+0n/kxn dx=k+k n
为求上式极值,以 k k k 为自变量求导,令 d O d k = 1 − 1 2 n k − 3 2 = 0 \frac {dO}{dk}=1-\frac 12 nk^{-\frac 32}=0 dkdO=121nk23=0 ,
得到 k = O ( n 2 / 3 ) k=O(n^{2/3}) k=O(n2/3) ,此时总时间复杂度为 O ( n 2 / 3 ) O(n^{2/3}) O(n2/3)

相关文章:

  • Android学习总结之事件分发机制篇
  • JavaScript基础-顺序流程控制
  • 力扣解题汇总(困难)
  • 【翻译、转载】【译文】图解模型上下文协议(MCP)
  • Linux线程深度解析:从基础到实践
  • 在两个bean之间进行数据传递的解决方案
  • 【五一培训】Day 4
  • Nginx核心功能 02
  • 《Vue3学习手记8》
  • P1603 斯诺登密码详解
  • C与指针——结构与联合
  • NPP库中libnppist模块介绍
  • Kubernetes 安装 kubectl
  • profile软件开发中的性能剖析与内存分析
  • 牛客周赛91 D题(数组4.0) 题解
  • RPG8.增加武器
  • 什么是右值引用和移动语义?大白话解释
  • Vue 虚拟DOM和DIff算法
  • 学习Linux的第一天
  • 初试C++报错并解决记录
  • 莫斯科一机场实施临时限制措施
  • 辽宁男篮被横扫这一晚,中国篮球的一个时代落幕了
  • 天津航空一航班盘旋14圈才降落,客服:因天气影响
  • 陈逸飞《黄河颂》人物造型与借鉴影像意义
  • 乌方公布矿产协议详情:未提债务义务,包含美再援助条款
  • 深交所修订创业板指数编制方案,引入ESG负面剔除机制