【libm】 7 内核余弦函数 (k_cos.rs)
一、源码
这段代码实现了在区间 [-π/4, π/4] 上的高精度余弦函数计算,是数学库中的核心计算部分。
// origin: FreeBSD /usr/src/lib/msun/src/k_cos.c
//
// ====================================================
// Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
//
// Developed at SunSoft, a Sun Microsystems, Inc. business.
// Permission to use, copy, modify, and distribute this
// software is freely granted, provided that this notice
// is preserved.
// ====================================================const C1: f64 = 4.16666666666666019037e-02; /* 0x3FA55555, 0x5555554C */
const C2: f64 = -1.38888888888741095749e-03; /* 0xBF56C16C, 0x16C15177 */
const C3: f64 = 2.48015872894767294178e-05; /* 0x3EFA01A0, 0x19CB1590 */
const C4: f64 = -2.75573143513906633035e-07; /* 0xBE927E4F, 0x809C52AD */
const C5: f64 = 2.08757232129817482790e-09; /* 0x3E21EE9E, 0xBDB4B1C4 */
const C6: f64 = -1.13596475577881948265e-11; /* 0xBDA8FAE9, 0xBE8838D4 */// kernel cos function on [-pi/4, pi/4], pi/4 ~ 0.785398164
// Input x is assumed to be bounded by ~pi/4 in magnitude.
// Input y is the tail of x.
//
// Algorithm
// 1. Since cos(-x) = cos(x), we need only to consider positive x.
// 2. if x < 2^-27 (hx<0x3e400000 0), return 1 with inexact if x!=0.
// 3. cos(x) is approximated by a polynomial of degree 14 on
// [0,pi/4]
// 4 14
// cos(x) ~ 1 - x*x/2 + C1*x + ... + C6*x
// where the remez error is
//
// | 2 4 6 8 10 12 14 | -58
// |cos(x)-(1-.5*x +C1*x +C2*x +C3*x +C4*x +C5*x +C6*x )| <= 2
// | |
//
// 4 6 8 10 12 14
// 4. let r = C1*x +C2*x +C3*x +C4*x +C5*x +C6*x , then
// cos(x) ~ 1 - x*x/2 + r
// since cos(x+y) ~ cos(x) - sin(x)*y
// ~ cos(x) - x*y,
// a correction term is necessary in cos(x) and hence
// cos(x+y) = 1 - (x*x/2 - (r - x*y))
// For better accuracy, rearrange to
// cos(x+y) ~ w + (tmp + (r-x*y))
// where w = 1 - x*x/2 and tmp is a tiny correction term
// (1 - x*x/2 == w + tmp exactly in infinite precision).
// The exactness of w + tmp in infinite precision depends on w
// and tmp having the same precision as x. If they have extra
// precision due to compiler bugs, then the extra precision is
// only good provided it is retained in all terms of the final
// expression for cos(). Retention happens in all cases tested
// under FreeBSD, so don't pessimize things by forcibly clipping
// any extra precision in w.
#[cfg_attr(all(test, assert_no_panic), no_panic::no_panic)]
pub(crate) fn k_cos(x: f64, y: f64) -> f64 {let z = x * x;let w = z * z;let r = z * (C1 + z * (C2 + z * C3)) + w * w * (C4 + z * (C5 + z * C6));let hz = 0.5 * z;let w = 1.0 - hz;w + (((1.0 - w) - hz) + (z * r - x * y))
}
二、函数目的
计算 cos(x + y) 的近似值,其中:
-
x 是主要参数(|x| ≤ π/4)
-
y 是 x 的尾部(更小的部分)
三、算法实现
- 多项式近似:
-
使用14次多项式近似余弦函数
-
多项式形式:1 - x²/2 + C₁x⁴ + C₂x⁶ + … + C₆x¹⁴
-
系数 C₁-C₆ 预先计算并以十六进制和十进制两种形式给出
- 计算步骤:
-
计算 z = x²
-
计算 w = z² (即 x⁴)
-
计算多项式项 r,分为两部分:
-
低次项:z*(C₁ + z*(C₂ + z*C₃))
-
高次项:ww(C₄ + z*(C₅ + zC₆)) (即 x⁸(C₄ + …))
-
-
计算主要部分 w = 1 - z/2
-
计算修正项:
- (1.0 - w) - hz 是精确计算 z/2 - (1 - w) 的补偿项
- zr - xy 是尾部修正
3 最终组合:
- 结果 = w + (补偿项 + 修正项)
四、数学原理
- 多项式近似:
-
基于余弦函数的泰勒级数展开
-
使用雷米兹算法优化多项式系数,在区间内最小化最大误差
-
误差界限 ≤ 2⁻⁵⁸(极高精度)
- 补偿计算:
-
使用 (1.0 - w) - hz 而非直接计算 z/2 - (1 - w) 是为了避免精度损失
-
这种形式保留了更多的有效数字
- 尾部修正:
-
x*y 项处理了 cos(x+y) 中的 y 的影响
-
基于近似 cos(x+y) ≈ cos(x) - x*y
五、精度保证
-
注释指出多项式近似的最大误差不超过 2⁻⁵⁸
-
使用补偿算法避免中间计算中的精度损失
-
所有操作都设计为保持最大可能的精度
六、性能优化
-
使用霍纳法则(Horner’s method)计算多项式(嵌套乘法)
-
将多项式分为两部分计算,可能有助于指令级并行
-
避免条件分支,适合流水线执行
七、特殊考虑
-
对于极小的 x(|x| < 2⁻²⁷),调用者应直接返回1.0
-
注释提到处理编译器可能引入的额外精度问题
八、代码特点
1. 常数定义:
-
每个常数同时给出十进制和十六进制表示
-
十六进制表示确保精确的位模式
- 无分支设计:
-
整个函数没有条件判断
-
完全基于算术运算
- 精细的误差控制:
- 每一步计算都考虑精度保持
这个实现是数学库中典型的专业数值计算代码,结合了数学理论(多项式近似)、计算机算术(精度控制)和硬件特性(性能优化)的深入知识。