当前位置: 首页 > news >正文

四、函数调用包含单个参数之Double类型-mmword,movsd,mulsd,addsd指令,总结汇编的数据类型

一、汇编代码

上一节开始,讲到了很多debug编译独有的汇编方式,为了更好的区分release的编译器优化和debug的区别,从本章节开始将会提供debug和release的汇编用作对比

Debugb编译

single_double_param:00000000000000A0: F2 0F 11 44 24 08  movsd       mmword ptr [rsp+8],xmm000000000000000A6: 57                 push        rdi00000000000000A7: 48 83 EC 10        sub         rsp,10h00000000000000AB: 48 8B FC           mov         rdi,rsp00000000000000AE: B9 04 00 00 00     mov         ecx,400000000000000B3: B8 CC CC CC CC     mov         eax,0CCCCCCCCh00000000000000B8: F3 AB              rep stos    dword ptr [rdi]00000000000000BA: F2 0F 10 44 24 20  movsd       xmm0,mmword ptr [rsp+20h]00000000000000C0: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]00 0000000000000000C8: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]00 0000000000000000D0: 48 83 C4 10        add         rsp,10h00000000000000D4: 5F                 pop         rdi00000000000000D5: C3                 ret

Release编译

single_double_param:0000000000000000: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]00 000000000000000008: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]00 000000000000000010: C3                 ret

二、汇编分析

1. 栈区空间

和浮点类型类似的同样需要申请16个字节的安全空间,使用的方法也是一样的,同时在release编译中也优化掉了这一部分。详细介绍请看上一章节

sub rsp, 10h                    ; 分配16字节栈空间
mov rdi, rsp                    ; rdi指向栈顶
mov ecx, 4                      ; 循环4次
mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)
rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)

2. Double类型在内存空间的表示

在计算机编程中,double类型(双精度浮点数)的内存空间占用和结构遵循IEEE 754标准,无论系统架构(32位或64位)或编译器类型,double类型始终占用 ​​8字节(64位)内存空间​​,这是IEEE 754标准对双精度浮点数的统一规定,与单精度浮点数(float,4字节)和长双精度(long double,通常16字节)形成对比。

double类型的64位内存空间划分为三个部分:

a.符号位(Sign)​​:1位

0表示正数,1表示负数

b. 指数位(Exponent)​​:11位

采用偏移表示法(偏移量1023),实际指数范围为 ​​-1022 到 1023​​,支持表示极大或极小的数值(如±10⁻³⁰⁸ 到 ±10³⁰⁸)

c. 尾数位(Mantissa)​​:52位

存储小数部分,隐含整数位1(规格化数),实际精度为 ​​53位二进制有效数字​​,等效约 ​​15–17位十进制有效数字

这部分的计算方式完全和float类型一致,只是不同类型的位数不同

3. mmword

MMWORD 是 ​​x86/x64 汇编语言​​中的一种数据类型标识符,主要用于处理 ​​64 位多媒体操作数​​,尤其在 MMX(MultiMedia eXtensions)和 SSE(Streaming SIMD Extensions)指令集中。以下是其核心要点:

a. 数据类型标识

  • MMWORD 在汇编中表示一个 ​​64 位(8 字节)的多媒体数据单元​​,与 __m64(C/C++ 中的 MMX 数据类型)等价
  • 用于明确操作数的位宽和语义,避免与普通整型混淆(如 QWORD 虽同为 64 位,但表示无符号整数)

b. 指令操作对象

常见于 MMX/SSE 指令的操作数中,例如:

movq mm0, mmword ptr [ebx]   ; 将内存中 64 位数据加载到 MMX 寄存器 mm0

mmword ptr 修饰内存地址,指明操作数大小为 64 位

拓展:

windows x64汇编中常见的数据单位总结

一、 基础存储单位

单位​位宽​​字节数​​定义​典型应用​
​bit1位1/8字节最小二进制单元(0或1)布尔运算、硬件标志位
Byte6位1字节由8个bit组成,存储基本单元字符编码(ASCII)、内存寻址最小单位
Word​16位2字节早期CPU一次处理的数据长度16位系统整数运算(如8086)
​DWord​32位4字节双字(Double Word),由2个Word组成32位系统整数/指针操作
QWord​64位8字节四字(Quad Word),由4个Word或2个DWord组成64位系统长整型、双精度浮点数

💡 ​​关键说明​​:

  • ​Word长度可变性​​:在32位系统中,Word可能被定义为32位(如x86架构)
  • ​字节固定性​​:1 Byte恒等于8 bit,不受架构影响

二、 多媒体拓展单位(SIMD指令集专用)

单位​位宽​字节数​​对应指令集​​典型应用​
MMWord​64位8字节MMX早期图像/音频处理(如像素块操作)
XMMWord​128位16字节SSE/AVX向量化浮点运算(如4×32位浮点并行)

🔬 ​​技术演进​​:

  • ​MMWord​​:复用FPU寄存器,操作64位整数
  • ​XMMWord​​:SSE引入独立128位寄存器,支持浮点与整型并行计算

4. 逻辑运算指令

该示例中用到了movsd,mulsd,addsd三种64位的浮点数运算

​指令​​操作数格式​​功能​详细介绍适用场景​
MOVSDxmm_dest, src复制浮点数将 ​​64 位双精度浮点数​​ 从源操作数(内存或 XMM 寄存器)复制到目标操作数(XMM 寄存器)加载/存储浮点数据
MULSDxmm_dest, src浮点数乘法将目标 XMM 寄存器中的双精度浮点数 ​​乘以​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量乘法运算
ADDSDxmm_dest, src浮点数加法将目标 XMM 寄存器中的双精度浮点数 ​​加上​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量加法运算

三、 汇编转化

movsd mmword ptr [rsp+8], xmm0  ; 将浮点参数保存到栈[rsp+8]
push rdi                        ; 保存rdi寄存器(被调用者保存)
sub rsp, 10h                    ; 分配16字节栈空间
mov rdi, rsp                    ; rdi指向栈顶
mov ecx, 4                      ; 循环4次
mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)
rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)
movsd xmm0, mmword ptr [rsp+20h]  ; 从栈[rsp+0x20]加载参数到xmm0
mulsd xmm0, mmword ptr [__real@4004000000000000]  ; 乘以常量2.5(0x400400...)
addsd xmm0, mmword ptr [__real@3ff4000000000000]  ; 加上常量1.25(0x3ff400...)

转化成C语言

double single_double_param(double param) {// 调试模式下的栈初始化(对应 rep stos 指令),release则会优化掉这部分volatile char debug_fill[16]; // 0xCC填充的栈空间// 核心计算逻辑(对应 mulsd/addsd)return param * 2.5 + 1.25;
}

相关文章:

  • PyCharm项目和文件运行时使用conda环境的教程
  • Postgresql常规SQL语句操作
  • 低代码采购系统搭建:鲸采云+能源行业订单管理自动化案例
  • SQL进阶之旅 Day 15:动态SQL与条件查询构建
  • 五大主流大模型推理引擎深度解析:llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的终极选择指南
  • 【论文阅读笔记】Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation
  • parquet :开源的列式存储文件格式
  • DeepSeek 赋能智能零售,解锁动态定价新范式
  • 60天python训练计划----day44
  • 阿里云ACP云计算备考笔记 (3)——云服务器ECS
  • 传输层协议 UDP 介绍 -- UDP 协议格式,UDP 的特点,UDP 的缓冲区
  • 结节性甲状腺肿全流程大模型预测与决策系统总体架构设计方案大纲
  • 基于 qiankun + vite + vue3 构建微前端应用实践
  • Git-git跟踪大文件
  • Modbus转EtherNET IP网关开启节能改造新范式
  • 工业自动化DeviceNET从站转Ethernet/IP主站网关赋能冶金行业工业机器人高效运行
  • AD四层板的层叠设计
  • 可编辑精品PPT | 大型企业数字化转型顶层业务架构模型解决方案数字化架构图合集可编辑架构图系统架构图技术架构图
  • ShardingSphere 如何解决聚合统计、分页查询和join关联问题
  • 【系统架构设计师】绪论-系统架构概述
  • b2b免费信息发布网站/seo快排优化
  • 上传的网站打不开/宁波网络推广软件
  • 网站建设做什么/百度app安装免费下载
  • 怎么用vs做动态网站/seo优化网络推广
  • 发稿类别是什么/sem和seo是什么职业
  • 做网站的专业叫什么/国内优秀个人网站欣赏