当前位置: 首页 > news >正文

【学Rust写CAD】31 muldiv255函数(muldiv255.rs,已经取消)

源码

// Calculates floor(a*b/255 + 0.5)
#[inline]
pub fn muldiv255(a: u32, b: u32) -> u32 {
    // The deriviation for this formula can be
    // found in "Three Wrongs Make a Right" by Jim Blinn.
    let tmp = a * b + 128;
    (tmp + (tmp >> 8)) >> 8
}

代码分析

这个 muldiv255 函数是一个高效的实现,用于计算 floor(a * b / 255 + 0.5),也就是将两个无符号整数 a 和 b 相乘,然后除以 255,并进行四舍五入。这种计算在图像处理中很常见,比如在 alpha 混合(alpha blending)或颜色空间转换时。

步骤分解:
  1. a * b + 128:
  • 首先计算 a * b,然后加上 128。这个 128 的作用是为了后续的四舍五入(因为 255 / 2 = 127.5,所以加 128 可以确保正确的舍入)。
  1. tmp + (tmp >> 8):
  • tmp >> 8 相当于 tmp / 256(右移 8 位相当于除以 2^8)。

  • 然后 tmp + (tmp >> 8) 相当于 tmp + tmp / 256。

  1. 8:

  • 最后右移 8 位,相当于除以 256。

为什么这个公式有效?

这个方法的数学原理来自 Jim Blinn 的文章 “Three Wrongs Make a Right”,它利用了近似计算来避免昂贵的除法运算(因为整数除法在 CPU 上通常比乘法和移位慢)。

  • 原本的计算是 (a * b + 127) / 255(四舍五入)。

  • 但 (a * b + 128) * 257 / 65536(即 (tmp + (tmp >> 8)) >> 8)是一个近似计算,可以高效地用移位和加法实现。

数学推导:

  1. 我们希望计算 (a * b + 127) / 255(四舍五入)。

  2. 可以近似为 (a * b + 128) * (256 + 1) / 65536(因为 255 ≈ 65536 / 257)。

展开后:

(a * b + 128) * (256 + 1) / 65536
= (256*(a*b + 128) + (a*b + 128)) / 65536
= ( (a*b + 128) << 8 + (a*b + 128) ) >> 16
= (tmp << 8 + tmp) >> 16
= (tmp + (tmp >> 8)) >> 8

最终得到 (tmp + (tmp >> 8)) >> 8。

示例

假设 a = 100, b = 200:

  1. tmp = 100 * 200 + 128 = 20000 + 128 = 20128

  2. tmp >> 8 = 20128 / 256 = 78

  3. tmp + (tmp >> 8) = 20128 + 78 = 20206

20206 >> 8 = 20206 / 256 = 78(实际 100 * 200 / 255 ≈ 78.431,四舍五入得 78)

为什么不用 (a * b + 127) / 255?

虽然 (a * b + 127) / 255 也能得到正确结果,但:

  • 除法 (/ 255) 在 CPU 上通常比移位和加法慢。

  • 这个优化方法避免了除法,改用移位和加法,性能更高。

适用场景

  • 图像处理(如 alpha 混合、颜色计算)。

  • 需要高效计算 (a * b) / 255 并四舍五入的情况。

总结

这个函数巧妙地利用移位和加法来近似计算 (a * b) / 255 并四舍五入,避免了昂贵的除法运算,是一种高效的位操作优化方法。


文章转载自:

http://K6X70CbN.cjrmf.cn
http://uqamT5QZ.cjrmf.cn
http://mbWHppOa.cjrmf.cn
http://Bd5hCIBP.cjrmf.cn
http://uGTwz6bE.cjrmf.cn
http://80wJSiue.cjrmf.cn
http://Q16Uo8XE.cjrmf.cn
http://9MIJ1afL.cjrmf.cn
http://jdLYmnO9.cjrmf.cn
http://GUrX9RYz.cjrmf.cn
http://Wwd6XleV.cjrmf.cn
http://tglKCHTR.cjrmf.cn
http://JzFqOIde.cjrmf.cn
http://CVGFDYQO.cjrmf.cn
http://u19d9CZk.cjrmf.cn
http://yvzUSSuu.cjrmf.cn
http://p1HtPDS9.cjrmf.cn
http://fCMxyWPb.cjrmf.cn
http://LIAzU6kv.cjrmf.cn
http://SNgPPIYS.cjrmf.cn
http://Lcv5irqj.cjrmf.cn
http://i4zkzEVC.cjrmf.cn
http://nzlwCval.cjrmf.cn
http://dTbOTltH.cjrmf.cn
http://yAVI1ZQx.cjrmf.cn
http://XFL9IY9C.cjrmf.cn
http://r59xEMRE.cjrmf.cn
http://ezdYzQta.cjrmf.cn
http://GhLWhbQL.cjrmf.cn
http://nEzvHuqa.cjrmf.cn
http://www.dtcms.com/a/116393.html

相关文章:

  • 【ElasticSearch】
  • linux | ubuntu安装docker
  • 破局与赋能:信息系统战略规划方法论
  • 【从零实现Json-Rpc框架】- 项目实现 - 服务端registrydiscovery实现
  • MySQL Explain 分析 SQL 执行计划
  • Navicat Premium 17 安装教程
  • P4779 【模板】单源最短路径(标准版)
  • Vue CLI创建项目指南
  • 【leetcode100】买卖股票的最佳时机
  • 小家电等电子设备快充方案,XSP15支持全协议和支持MCU与电脑传输数据
  • 自动化备份全网服务器数据平台
  • 快手Python开发面经及参考答案
  • Android Canvas动画实践:实现小球旋转、扩散、聚合效果
  • VS2022远程调试Linux程序
  • LeetCode 1863. 找出所有子集的异或总和再求和
  • ROS2笔记-2:第一个在Gazebo中能动的例子
  • Linux——冯 • 诺依曼体系结构操作系统初识
  • C#核心学习(六)面向对象--封装(5)静态成员及静态构造函数和静态类 以及和常量的区别
  • 《手写MyBatis框架全流程:从DOM4J解析到SQL执行原理剖析》
  • 七、C++速通秘籍—静态多态(编译期)
  • 预测函数控制(PFC)——理论、应用与实践
  • 学透Spring Boot — 014. Spring MVC的自动配置
  • CANoe CAPL——CAN CAPL函数
  • jQuery 文本属性值
  • OceanBase生态2.0:如何实现“三分天下有其一”?
  • 应用层自定义协议与序列化
  • 【AI提示词】大学教授学术阅读(读论文)
  • 基于SpringBoot的售楼管理系统【附源码】
  • 记一次常规的网络安全渗透测试
  • SpringMVC与SpringCloud的区别