当前位置: 首页 > news >正文

【libm】 7 内核余弦函数 (k_cos.rs)

一、源码

这段代码实现了在区间 [-π/4, π/4] 上的高精度余弦函数计算,是数学库中的核心计算部分。

// origin: FreeBSD /usr/src/lib/msun/src/k_cos.c
//
// ====================================================
// Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
//
// Developed at SunSoft, a Sun Microsystems, Inc. business.
// Permission to use, copy, modify, and distribute this
// software is freely granted, provided that this notice
// is preserved.
// ====================================================const C1: f64 = 4.16666666666666019037e-02; /* 0x3FA55555, 0x5555554C */
const C2: f64 = -1.38888888888741095749e-03; /* 0xBF56C16C, 0x16C15177 */
const C3: f64 = 2.48015872894767294178e-05; /* 0x3EFA01A0, 0x19CB1590 */
const C4: f64 = -2.75573143513906633035e-07; /* 0xBE927E4F, 0x809C52AD */
const C5: f64 = 2.08757232129817482790e-09; /* 0x3E21EE9E, 0xBDB4B1C4 */
const C6: f64 = -1.13596475577881948265e-11; /* 0xBDA8FAE9, 0xBE8838D4 */// kernel cos function on [-pi/4, pi/4], pi/4 ~ 0.785398164
// Input x is assumed to be bounded by ~pi/4 in magnitude.
// Input y is the tail of x.
//
// Algorithm
//      1. Since cos(-x) = cos(x), we need only to consider positive x.
//      2. if x < 2^-27 (hx<0x3e400000 0), return 1 with inexact if x!=0.
//      3. cos(x) is approximated by a polynomial of degree 14 on
//         [0,pi/4]
//                                       4            14
//              cos(x) ~ 1 - x*x/2 + C1*x + ... + C6*x
//         where the remez error is
//
//      |              2     4     6     8     10    12     14 |     -58
//      |cos(x)-(1-.5*x +C1*x +C2*x +C3*x +C4*x +C5*x  +C6*x  )| <= 2
//      |                                                      |
//
//                     4     6     8     10    12     14
//      4. let r = C1*x +C2*x +C3*x +C4*x +C5*x  +C6*x  , then
//             cos(x) ~ 1 - x*x/2 + r
//         since cos(x+y) ~ cos(x) - sin(x)*y
//                        ~ cos(x) - x*y,
//         a correction term is necessary in cos(x) and hence
//              cos(x+y) = 1 - (x*x/2 - (r - x*y))
//         For better accuracy, rearrange to
//              cos(x+y) ~ w + (tmp + (r-x*y))
//         where w = 1 - x*x/2 and tmp is a tiny correction term
//         (1 - x*x/2 == w + tmp exactly in infinite precision).
//         The exactness of w + tmp in infinite precision depends on w
//         and tmp having the same precision as x.  If they have extra
//         precision due to compiler bugs, then the extra precision is
//         only good provided it is retained in all terms of the final
//         expression for cos().  Retention happens in all cases tested
//         under FreeBSD, so don't pessimize things by forcibly clipping
//         any extra precision in w.
#[cfg_attr(all(test, assert_no_panic), no_panic::no_panic)]
pub(crate) fn k_cos(x: f64, y: f64) -> f64 {let z = x * x;let w = z * z;let r = z * (C1 + z * (C2 + z * C3)) + w * w * (C4 + z * (C5 + z * C6));let hz = 0.5 * z;let w = 1.0 - hz;w + (((1.0 - w) - hz) + (z * r - x * y))
}

二、函数目的

计算 cos(x + y) 的近似值,其中:

  • x 是主要参数(|x| ≤ π/4)

  • y 是 x 的尾部(更小的部分)

三、算法实现

  1. 多项式近似:
  • 使用14次多项式近似余弦函数

  • 多项式形式:1 - x²/2 + C₁x⁴ + C₂x⁶ + … + C₆x¹⁴

  • 系数 C₁-C₆ 预先计算并以十六进制和十进制两种形式给出

  1. 计算步骤:
  • 计算 z = x²

  • 计算 w = z² (即 x⁴)

  • 计算多项式项 r,分为两部分:

    • 低次项:z*(C₁ + z*(C₂ + z*C₃))

    • 高次项:ww(C₄ + z*(C₅ + zC₆)) (即 x⁸(C₄ + …))

  • 计算主要部分 w = 1 - z/2

  • 计算修正项:

    • (1.0 - w) - hz 是精确计算 z/2 - (1 - w) 的补偿项
    • zr - xy 是尾部修正

3 最终组合:

  • 结果 = w + (补偿项 + 修正项)

四、数学原理

  1. 多项式近似:
  • 基于余弦函数的泰勒级数展开

  • 使用雷米兹算法优化多项式系数,在区间内最小化最大误差

  • 误差界限 ≤ 2⁻⁵⁸(极高精度)

  1. 补偿计算:
  • 使用 (1.0 - w) - hz 而非直接计算 z/2 - (1 - w) 是为了避免精度损失

  • 这种形式保留了更多的有效数字

  1. 尾部修正:
  • x*y 项处理了 cos(x+y) 中的 y 的影响

  • 基于近似 cos(x+y) ≈ cos(x) - x*y

五、精度保证

  • 注释指出多项式近似的最大误差不超过 2⁻⁵⁸

  • 使用补偿算法避免中间计算中的精度损失

  • 所有操作都设计为保持最大可能的精度

六、性能优化

  • 使用霍纳法则(Horner’s method)计算多项式(嵌套乘法)

  • 将多项式分为两部分计算,可能有助于指令级并行

  • 避免条件分支,适合流水线执行

七、特殊考虑

  • 对于极小的 x(|x| < 2⁻²⁷),调用者应直接返回1.0

  • 注释提到处理编译器可能引入的额外精度问题

八、代码特点

1. 常数定义:
  • 每个常数同时给出十进制和十六进制表示

  • 十六进制表示确保精确的位模式

  1. 无分支设计:
  • 整个函数没有条件判断

  • 完全基于算术运算

  1. 精细的误差控制:
  • 每一步计算都考虑精度保持

这个实现是数学库中典型的专业数值计算代码,结合了数学理论(多项式近似)、计算机算术(精度控制)和硬件特性(性能优化)的深入知识。

相关文章:

  • 大模型本周进展(0623~0629)
  • WSL安装发行版上安装podman
  • 常用期权定价模型
  • AI金融科技/区块链合规相关研究的经验
  • 力扣第85题-最大矩形
  • Java中对JSON的操作
  • StarRocks 3.5 新特性解读:Snapshot 快照恢复、大导入性能全面升级、分区管理更智能
  • redisson看门狗实现原理
  • OD 算法题 B卷【阿里巴巴找黄金宝箱4】
  • Vue 与react 生命周期对比
  • 机器学习-02(深度学习的基本概念)
  • chapter02_AbstractBeanfactory与模板方法
  • 力扣第87题-扰乱字符串
  • 支持向量机(SVM)在医疗诊断:医学影像领域的应用与实现
  • 现代 JavaScript (ES6+) 入门到实战(八):总结与展望 - 成为一名现代前端开发者
  • 现代 JavaScript (ES6+) 入门到实战(五):告别回调地狱,Promise 完全入门
  • PCB工艺学习与总结-20250628
  • Ubuntu20 编译安装 Redis7.2.4
  • MySQL 安装使用教程
  • Ubuntu22 安装 RTX 5070 Ti Nvidia Driver 驱动