当前位置：首页 > news >正文

洛谷 P3935 Calculating——因数个数定理+整除分块（数论分块）

news 2025/11/17 8:19:31

P3935 Calculating

首先有一个东西叫因数个数定理。

就是题目中的 $x=p1k1p2k2⋯pnknx=p_1^{k_1}p_2^{k_2}\cdots p_n^{k_n}$ ，那么 $x$ 的因数的个数为 $(k1+1)(k2+1)⋯(kn+1)(k_1+1)(k_2+1)\cdots (k_n+1)$ 。

证明

根据短除法可知，任何一个不小于 $2$ 的数，都可以分解成若干个素数相乘；

又因为， $a^b=a^xa^{b-x}$ （其中 $0≤x≤b0\leq x \leq b$ ）；

所以 $n$ 个相同的数可以被分成 $b - 0 + 1 = b + 1$ 个不同的数乘以某个数；

即对于 $∀i\forall i$ ， $p_i^{k_i}$ 含 $k_i+1$ 个不同的整数（且他们的质因数只有 $p_i$ ）；

最后根据乘法原理，就得出上式。

显而易见，这道题就变成了，求 $l$ 到 $r$ 中所有数字的因数个数和。

因为数很多，所以枚举每个数字并计算它的因素的个数。显然是要TLE的。

考虑到，肯定会有很多数存在公因数，因此我们枚举每个因数显然更快一些。

现在再引入类似前缀和的原理，我们先求 $[1, l)$ 中所有数字的因数个数和，再求 $[1, r]$ 中所有数字的因数个数和，最后相减就是答案（ $[l, r]$ 中所有数字的因数个数和）了。

$t1=∑i∈[1,l)g(i)t2=∑i∈[1,r]g(i)ans=∑i∈[l,r]g(i)=t2−t1t_1=\sum_{i\in[1,l)}g(i)\\ t_2=\sum_{i\in[1,r]}g(i)\\ ans=\sum_{i\in[l,r]}g(i)=t_2-t_1$

其中 $g (i)$ 表示 $i$ 的因数个数

上文的 $∑i∈[1,x]g(i)\sum_{i\in[1,x]}g(i)$ 到底怎么快速求解呢？

我们先将式子转化一下：
$∑i∈[1,x]g(i)=∑i=1n∑j∣i1=∑i=1n⌊ij⌋\sum_{i\in[1,x]}g(i)=\sum_{i=1}^{n}\sum_{j|i}1=\sum_{i=1}^{n}{\lfloor \frac {i}{j}\rfloor}$

其中 $x ∣ y$ 表示 $x$ 整除 $y$ （ $y$ 整除以 $x$ （ $ymodx=0y\mod x=0$ ））

解释

求 $[1, n]$ 中所有因数的个数（ $∑i∈[1,x]g(i)\sum_{i\in[1,x]}g(i)$ ）；最直接的办法就是先枚举 $[1, n]$ （ $∑i=1n\sum_{i=1}^{n}$ ），再枚举其中每个数的因数，并累加数量 $∑j∣i1\sum_{j|i}1$ ；跟前面说的一样，枚举每个因数显然会快一些，因此我们就可以枚举 $[1, n]$ ，并求出该数字在 $n$ 以内的整倍数数量（ $∑i=1n⌊ij⌋\sum_{i=1}^{n}{\lfloor \frac {i}{j}\rfloor}$ ）。

显然，这样做可以把时间复杂度从 $O(n^2)$ 降到 $O (n)$ ，但还不够。

注意到，总会有相邻的几个数在范围内的整倍数相同，那我们就尝试把整倍数书相同的（当然就相邻的）几个数分为一块儿，一起求解；这就是整除分块。

为了方便理解，我们观察图像（ $n = 10$ )。

在这里插入图片描述

（横着的） $x$ 轴：遍历 $[1, n]$ 的每个数
（竖着的） $y$ 轴：对应的数的整倍数数

显然，这是一个反比例函数（解析式为 $y=nxy=\frac{n}{x}$ ），它关于 $y = x$ 对称，交对称轴于 $(n,n)(\sqrt n, \sqrt n)$ 。

因此，我们可以把 $n$ 分成两个部分（区间），分别是 $i<=ni<=\sqrt n$ 和 $i>ni>\sqrt n$ （ $x$ 相当于 $i$ ）：

对于 $i<=ni<=\sqrt n$ 的部分，其 $kf≤−1k_f\leq-1$ （仅 $i=ni=\sqrt n$ 时 $k_f=-1$ ）（ $k_f$ 表示斜率），每个点对应的答案各不相同；
对于 $i>ni>\sqrt n$ 的部分，其 $k_f>-1$ ；会出现有些点对应的答案相同的情况。

第一种情况暴力枚举 $[1,n][1,\sqrt n]$ 就好了（时间复杂度 $O(n)O(\sqrt n)$ ）。

而第二种情况我们怎么知道哪些点对应的答案相同呢？

——根据函数的对称性。（还是上图）

描的每个蓝点代表对应的 $i$ 对应的答案。

我们任取一点 $D$ ，求它所在的相同答案区间的右界。

因为函数的对称性，所以我们可以直接把 $D$ 点对应（映射）到 $L$ 点，而 $D$ 点所在的区间的右界就是 $L$ 所在区间（严格来说只能是一条线段）的上界（ $B$ 点）。

这是怎么求出来的呢？直接说结论： $(x, y)$ 关于 $y = x$ 的对称点为 $(y, x)$ 。

证明

因为 $y = x$ 是平面直角坐标系第一象限和第三象限的角平分线；

所以 $x$ 轴与 $y$ 轴互为关于 $y = x$ 对称关系；

所以找 $(x, y)$ 关于 $y = x$ 的对称点相当于互换了坐标轴，得到 $(y, x)$ 。

因此， $i>ni>\sqrt n$ 时我们可以先求出 $i$ 对应的答案 $y$ ，然后再求出 $y$ 对应的答案，就是 $i$ 所在区间的右界了。

每个区间的总答案就是其中任意一个点的答案乘以区间长度。

这样的操作只会进行 $n\sqrt n$ 次（ $n\sqrt n$ 左边有 $n$ 个点， $n\sqrt n$ 右边就有 $n$ 个区间），因此时间复杂度也是 $O(n)O(\sqrt n)$ 。

#include<cstdio>
#include<cmath>
inline long long read(){		//快读char t;long long x=0;do{t=getchar();}while(t<'0' || '9'<t);while('0'<=t && t<='9'){x=x*10+t-'0';t=getchar();}return x;
}
constexpr long long mod=998244353;
inline long long sum(long long x){long long s=0;for(long long i=1; i<=sqrt(x); ++i) s+=x/i;		//sqrt(x)以内直接枚举for(long long i=sqrt(x)+1, t; i<=x; i=t+1){t=x/(x/i);		//当前区间的右界s+=x/i*(t-i+1);		//当前区间的总答案（(t-i+1)就是区间长度）s%=mod;}return s;
}
int main(){long long l, r;l=read();r=read();printf("%lld", (sum(r)-sum(l-1)+mod)%mod);		//经过取模，不能保证sum(r)>sum(l-1)return 0;
}