当前位置：首页 > news >正文

【libm】 7 内核余弦函数 (k_cos.rs)

news 来源：原创 2025/6/30 7:05:31

一、源码

这段代码实现了在区间 [-π/4, π/4] 上的高精度余弦函数计算，是数学库中的核心计算部分。

// origin: FreeBSD /usr/src/lib/msun/src/k_cos.c
//
// ====================================================
// Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
//
// Developed at SunSoft, a Sun Microsystems, Inc. business.
// Permission to use, copy, modify, and distribute this
// software is freely granted, provided that this notice
// is preserved.
// ====================================================const C1: f64 = 4.16666666666666019037e-02; /* 0x3FA55555, 0x5555554C */
const C2: f64 = -1.38888888888741095749e-03; /* 0xBF56C16C, 0x16C15177 */
const C3: f64 = 2.48015872894767294178e-05; /* 0x3EFA01A0, 0x19CB1590 */
const C4: f64 = -2.75573143513906633035e-07; /* 0xBE927E4F, 0x809C52AD */
const C5: f64 = 2.08757232129817482790e-09; /* 0x3E21EE9E, 0xBDB4B1C4 */
const C6: f64 = -1.13596475577881948265e-11; /* 0xBDA8FAE9, 0xBE8838D4 */// kernel cos function on [-pi/4, pi/4], pi/4 ~ 0.785398164
// Input x is assumed to be bounded by ~pi/4 in magnitude.
// Input y is the tail of x.
//
// Algorithm
//      1. Since cos(-x) = cos(x), we need only to consider positive x.
//      2. if x < 2^-27 (hx<0x3e400000 0), return 1 with inexact if x!=0.
//      3. cos(x) is approximated by a polynomial of degree 14 on
//         [0,pi/4]
//                                       4            14
//              cos(x) ~ 1 - x*x/2 + C1*x + ... + C6*x
//         where the remez error is
//
//      |              2     4     6     8     10    12     14 |     -58
//      |cos(x)-(1-.5*x +C1*x +C2*x +C3*x +C4*x +C5*x  +C6*x  )| <= 2
//      |                                                      |
//
//                     4     6     8     10    12     14
//      4. let r = C1*x +C2*x +C3*x +C4*x +C5*x  +C6*x  , then
//             cos(x) ~ 1 - x*x/2 + r
//         since cos(x+y) ~ cos(x) - sin(x)*y
//                        ~ cos(x) - x*y,
//         a correction term is necessary in cos(x) and hence
//              cos(x+y) = 1 - (x*x/2 - (r - x*y))
//         For better accuracy, rearrange to
//              cos(x+y) ~ w + (tmp + (r-x*y))
//         where w = 1 - x*x/2 and tmp is a tiny correction term
//         (1 - x*x/2 == w + tmp exactly in infinite precision).
//         The exactness of w + tmp in infinite precision depends on w
//         and tmp having the same precision as x.  If they have extra
//         precision due to compiler bugs, then the extra precision is
//         only good provided it is retained in all terms of the final
//         expression for cos().  Retention happens in all cases tested
//         under FreeBSD, so don't pessimize things by forcibly clipping
//         any extra precision in w.
#[cfg_attr(all(test, assert_no_panic), no_panic::no_panic)]
pub(crate) fn k_cos(x: f64, y: f64) -> f64 {let z = x * x;let w = z * z;let r = z * (C1 + z * (C2 + z * C3)) + w * w * (C4 + z * (C5 + z * C6));let hz = 0.5 * z;let w = 1.0 - hz;w + (((1.0 - w) - hz) + (z * r - x * y))
}

二、函数目的

计算 cos(x + y) 的近似值，其中：

x 是主要参数（|x| ≤ π/4）
y 是 x 的尾部（更小的部分）

三、算法实现

多项式近似：

使用14次多项式近似余弦函数
多项式形式：1 - x²/2 + C₁x⁴ + C₂x⁶ + … + C₆x¹⁴
系数 C₁-C₆ 预先计算并以十六进制和十进制两种形式给出

计算步骤：

计算 z = x²
计算 w = z² (即 x⁴)
计算多项式项 r，分为两部分：
- 低次项：z*(C₁ + z*(C₂ + z*C₃))
- 高次项：ww(C₄ + z*(C₅ + zC₆)) (即 x⁸(C₄ + …))
计算主要部分 w = 1 - z/2
计算修正项：
- (1.0 - w) - hz 是精确计算 z/2 - (1 - w) 的补偿项
- zr - xy 是尾部修正

3 最终组合：

结果 = w + (补偿项 + 修正项)

四、数学原理

多项式近似：

基于余弦函数的泰勒级数展开
使用雷米兹算法优化多项式系数，在区间内最小化最大误差
误差界限 ≤ 2⁻⁵⁸（极高精度）

补偿计算：

使用 (1.0 - w) - hz 而非直接计算 z/2 - (1 - w) 是为了避免精度损失
这种形式保留了更多的有效数字

尾部修正：

x*y 项处理了 cos(x+y) 中的 y 的影响
基于近似 cos(x+y) ≈ cos(x) - x*y

五、精度保证

注释指出多项式近似的最大误差不超过 2⁻⁵⁸
使用补偿算法避免中间计算中的精度损失
所有操作都设计为保持最大可能的精度

六、性能优化

使用霍纳法则（Horner’s method）计算多项式（嵌套乘法）
将多项式分为两部分计算，可能有助于指令级并行
避免条件分支，适合流水线执行

七、特殊考虑

对于极小的 x（|x| < 2⁻²⁷），调用者应直接返回1.0
注释提到处理编译器可能引入的额外精度问题

八、代码特点

1. 常数定义：

每个常数同时给出十进制和十六进制表示
十六进制表示确保精确的位模式

无分支设计：

整个函数没有条件判断
完全基于算术运算

精细的误差控制：

每一步计算都考虑精度保持

这个实现是数学库中典型的专业数值计算代码，结合了数学理论（多项式近似）、计算机算术（精度控制）和硬件特性（性能优化）的深入知识。

大模型本周进展（0623~0629）

WSL安装发行版上安装podman

常用期权定价模型

AI金融科技/区块链合规相关研究的经验

力扣第85题-最大矩形

Java中对JSON的操作

StarRocks 3.5 新特性解读：Snapshot 快照恢复、大导入性能全面升级、分区管理更智能

redisson看门狗实现原理

OD 算法题 B卷【阿里巴巴找黄金宝箱4】

Vue 与react 生命周期对比

机器学习-02（深度学习的基本概念）

chapter02_AbstractBeanfactory与模板方法

力扣第87题-扰乱字符串

支持向量机（SVM）在医疗诊断：医学影像领域的应用与实现

现代 JavaScript (ES6+) 入门到实战（八）：总结与展望 - 成为一名现代前端开发者

现代 JavaScript (ES6+) 入门到实战（五）：告别回调地狱，Promise 完全入门

PCB工艺学习与总结-20250628

Ubuntu20 编译安装 Redis7.2.4

MySQL 安装使用教程

Ubuntu22 安装 RTX 5070 Ti Nvidia Driver 驱动