当前位置: 首页 > news >正文

ARM 汇编基础

ARM 汇编是嵌入式开发、操作系统底层编程和性能优化的核心技能之一。以下是一份系统的 ARM 汇编指令教学指南,涵盖基础语法、核心指令、编程模式和实用示例。

​1. ARM 汇编基础

​ 1.1 寄存器
ARM 架构(32位)包含 ​16 个通用寄存器​(R0-R15),其中部分有特殊用途:

​R0-R12:通用寄存器,用于存储数据和地址。
​R13 (SP):栈指针(Stack Pointer),指向当前栈顶。
​R14 (LR):链接寄存器(Link Register),保存函数返回地址。
​R15 (PC):程序计数器(Program Counter),指向下一条要执行的指令。
​CPSR:当前程序状态寄存器(Condition Program Status Register),存储条件标志(如 Z、N、C、V)。

​2. ARM 汇编指令格式

ARM 指令通常遵循以下格式:

<操作码>{条件码}{S} <目标寄存器>, <操作数1>, <操作数2>
​条件码​(可选):如 EQ(相等)、NE(不等)、GT(大于)。
​S​(可选):更新 CPSR 标志(如 ADDS 会更新 Z/N/C/V 标志)。
​操作数:可以是寄存器、立即数或内存地址。

​3. 核心指令分类

​3.1 数据传输指令
MOV:将数据从一个寄存器或立即数复制到另一个寄存器。

MOV R0, #42       ; R0 = 42
MOV R1, R0        ; R1 = R0

LDR/STR:从内存加载数据到寄存器(Load)或从寄存器存储到内存(Store)。

LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 将 R2 的值存储到内存地址 R3 + 4

​3.2 算术运算
ADD/SUB:加法和减法。

ADD R0, R1, R2    ; R0 = R1 + R2
SUB R3, R3, #1    ; R3 = R3 - 1

MUL/MLA:乘法和乘加。

MUL R0, R1, R2    ; R0 = R1 * R2
MLA R0, R1, R2, R3 ; R0 = R1 * R2 + R3

​3.3 逻辑运算
AND/ORR/EOR/BIC:按位与、或、异或、位清除。

AND R0, R1, #0xFF ; R0 = R1 & 0xFF(取低8位)
BIC R0, R1, #0x3  ; R0 = R1 & ~0x3(清除最低2位)

​3.4 比较与分支
CMP:比较两个操作数并更新 CPSR。

CMP R0, R1        ; 计算 R0 - R1,更新标志位

B/BL:无条件跳转(Branch)或带链接的跳转(Branch with Link,用于函数调用)。

B   loop          ; 跳转到标签 loop
BL  my_function   ; 调用函数 my_function,返回地址存入 LR

​3.5 栈操作
PUSH/POP:压栈和弹栈操作(需指定寄存器列表)。

PUSH {R0, R1, LR} ; 将 R0, R1, LR 压入栈
POP  {R0, R1, PC} ; 从栈中恢复 R0, R1,并将返回地址写入 PC(函数返回)

​4. 寻址模式

​4.1 立即数寻址
使用 # 前缀表示立即数:

MOV R0, #0x100    ; R0 = 0x100

​注意:ARM 立即数需满足特定规则(如 8 位有效位 + 移位)。
​4.2 寄存器间接寻址
通过寄存器中的地址访问内存:

LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 存储到地址 R3 + 4

​4.3 基址变址寻址
支持偏移、前变址和后变址:

LDR R0, [R1, #8]! ; 前变址:R1 = R1 + 8,然后 R0 = [R1]
LDR R0, [R1], #8  ; 后变址:R0 = [R1],然后 R1 = R1 + 8

​5. 控制结构

​5.1 条件分支
根据 CPSR 标志跳转:

CMP R0, #10        ; 比较 R0 和 10
BGT greater_than    ; 若 R0 > 10,跳转到 greater_than

​5.2 循环
使用条件分支实现循环:

MOV R0, #0         ; 初始化计数器
loop:
  ADD R0, R0, #1   ; 计数器加1
  CMP R0, #5
  BLT loop         ; 若 R0 < 5,继续循环

​6. 函数调用

遵循 ​AAPCS​(ARM Architecture Procedure Call Standard)规范:

​参数传递:前 4 个参数通过 R0-R3 传递,后续参数通过栈传递。
​返回值:通过 R0 返回。
​保存寄存器:被调用函数需保护 R4-R11、SP、LR 等寄存器。
​示例:函数调用

.global main
main:
  MOV R0, #5       ; 参数 n = 5
  BL  factorial    ; 调用 factorial 函数
  BX  LR           ; 返回

factorial:
  PUSH {R4, LR}    ; 保存寄存器
  MOV R4, R0       ; 保存参数到 R4
  CMP R4, #1
  MOVEQ R0, #1     ; 若 n == 1,返回 1
  POPEQ {R4, PC}   ; 恢复寄存器并返回

  SUB R0, R4, #1   ; 计算 n-1
  BL  factorial    ; 递归调用 factorial(n-1)
  MUL R0, R4, R0   ; R0 = n * factorial(n-1)
  POP {R4, PC}     ; 恢复寄存器并返回

​7. 常见问题与调试

​7.1 立即数限制
如果立即数过大,需分步加载或使用 LDR 伪指令:

LDR R0, =0x12345678 ; 加载任意32位立即数(编译器自动处理)

​7.2 条件执行
几乎所有 ARM 指令都可条件执行:

ADDEQ R0, R1, R2    ; 仅在 Z 标志置位时执行加法

​7.3 调试工具
​GDB:使用 arm-none-eabi-gdb 调试汇编代码。
​QEMU:模拟 ARM 硬件环境。
​Keil/STM32CubeIDE:针对嵌入式硬件的集成调试环境。

8. 完整示例:计算阶乘

.global main
main:
  MOV R0, #5       ; 计算 5!
  BL  factorial
  B   exit

factorial:
  CMP R0, #1       ; 基准条件:n == 1
  MOVEQ PC, LR     ; 若满足,直接返回
  PUSH {R0, LR}    ; 保存当前 n 和返回地址
  SUB R0, R0, #1   ; n = n - 1
  BL  factorial    ; 递归调用 factorial(n-1)
  POP {R1, LR}     ; 恢复原 n 到 R1 和返回地址
  MUL R0, R1, R0   ; R0 = n * factorial(n-1)
  BX  LR           ; 返回

exit:
  ; 此处可添加退出代码

相关文章:

  • FPGA中串行执行方式之状态机
  • AWS CDK实战:用代码重新定义云基础设施部署
  • 基于RAG(Retrieval Augmented Generation)架构的简单问答系统的Python实现示例
  • xcode中移除安装的package dependency
  • Spring 事务传播方式
  • 解决Popwindow宽高的问题。
  • 大模型sft-数据构建和选择
  • [特殊字符] 2025蓝桥杯备赛Day7——B2117 整理药名
  • Q2 电商订单数据分析优化
  • WPF UI元素保存为图像文件
  • ip2region与express最佳实践
  • 一些硬件知识【2025/3/1】
  • Maven安装与环境配置
  • 各类神经网络学习:(四)RNN 循环神经网络(下集),pytorch 版的 RNN 代码编写
  • 练习题:98
  • 使用 Ansys Fluent 评估金属管道腐蚀
  • AIGC-名人语录账号运营创作智能体完整指令(DeepSeek,豆包,千问,Kimi,GPT)
  • 实现一个日语假名自测小程序html-css-js版
  • XSS漏洞原理分类标签及关卡
  • 一般c++项目的目录结构
  • 淮安市车桥中学党总支书记王习元逝世,终年51岁
  • 一个留美学生的思想转向——裘毓麐的《游美闻见录》及其他
  • 美官方将使用华为芯片视作违反美出口管制行为,外交部回应
  • 夜读丨母亲为燕子打开家门
  • 上海市国防动员办公室副主任吴斌接受审查调查
  • 西安市未央区委书记刘国荣已任西咸新区党工委书记