当前位置: 首页 > news >正文

DMA:在不同内存空间建立目的地址的情况分析及后果

文章目录

  • 前言
  • 一、DMA RAM Access Cached Address Space (DMA 访问缓存地址空间)
    • 1.1、含义
    • 1.2、潜在问题:数据不一致性
    • 1.3、如何解决/管理
  • 二、DMA RAM Access Non-Cached Address Space (DMA 访问非缓存地址空间)
    • 2.1、含义
    • 2.2、特点
    • 2.3、使用场景
  • 三、总结


前言

DMA,本章主要是想聊下关于DMA在不同内存空间建立目的地址的情况。如 DMA 访问缓存地址空间(Cached Address Space)和非缓存地址空

间(Non-Cached Address Space)的情况。这涉及到 CPU Cache 和 DMA 控制器是如何协同工作(或者不协同工作)的问题,核心就在于数据一致性。

一、DMA RAM Access Cached Address Space (DMA 访问缓存地址空间)

1.1、含义

DMA 控制器将要传输的数据的目标地址或源地址指向了 CPU Cache 管理的内存区域(通常是主 RAM 的一部分,这些部分被配置为可以被缓存)。

1.2、潜在问题:数据不一致性

  • **CPU 写入,DMA 读取:**CPU 将数据写入内存,数据进入 Cache (可能稍后写回主内存)。DMA 控制器直接从主内存读取数据。如果 CPU 的写操作还没有将数据写回主内存(例如,使用了 Write-Back 缓存策略),DMA 读取到的可能是旧数据或无数据。
  • **DMA 写入,CPU 读取:**DMA 控制器将数据写入主内存。CPU 要读取该数据时,CPU 可能会先检查 Cache 中的旧数据。如果该地址的数据之前被 CPU 访问过并缓存在 Cache 中,那么 CPU 读取到的就是 Cache 中的旧数据,而不是 DMA 刚刚写入的新数据。

1.3、如何解决/管理

  • **Cache Coherency Hardware缓存一致性硬件:**许多现代处理器(尤其是多核处理器和包含 DMA 的系统)内置了缓存一致性机制(如:MESI 协议及其变种)。这些机制确保当 DMA 控制器访问一个缓存行的地址时,相关的缓存行会被自动使其失效或置为共享状态,这样 CPU 之后的读取会从主内存获取最新数据,而 DMA 写入的数据也能被 CPU 看到。但是这变相的多出了 CPU 访问主存的时间。
  • **软件干预:**在没有硬件缓存一致性支持的系统中,或者需要精细控制时,软件必须介入:
    1、使缓存行失效
    在 DMA 读取前,显示地告知缓存控制器使包含目标地址的缓存行失效,强制 CPU 从主内存读取。
    2、写回并使失效
    在 DMA 写入前,如果 CPU 可能已经修改了该区域的数据并缓存了,需要先将缓存中的脏数据写回主存,然后使缓存行失效,确保 DMA 写入的是干净的主内存区域。
    3、内存屏障
    确保指令的执行顺序,防止 CPU 或编译器优化导致操作乱序。

二、DMA RAM Access Non-Cached Address Space (DMA 访问非缓存地址空间)

2.1、含义

DMA 控制器将要传输的数据的目标地址或源地址指向了被配置为不可缓存的内存区域。这些区域通常被映射到特定的硬件寄存器、设备内存(如GPU显存、网卡缓存区)或者被明确配置为非缓存的 RAM。

2.2、特点

  • CPU 对这些地址的访问会直接绕过 Cache,每次访问都访问主存。
  • DMA 控制器对这些地址的访问也直接访问主存。
  • 没有缓存一致性问题,因为根本不涉及 Cache,所以 CPU 和 DMA 之间不会因为 Cache 副本和内存副本不同而产生数据不一致的问题。CPU 写入的数据,DMA 一定能读到;DMA 写入的数据,CPU 一定能读到(只要地址正确)。

2.3、使用场景

  • **设备寄存器:**CPU需要直接、实时地读写硬件状态和控制位。
  • **中断向量表:**需要快速响应。
  • 某些需要精确控制访问延迟或避免 Cache 污染的内存区域。
  • 与外部设备交换数据的标准区域(如PCI BAR映射的内存)。

三、总结

特性DMA 访问缓存地址空间 CachedDMA 访问非缓存地址空间 Non-Cached
CPU 访问路径通过 Cache绕过 Cache,直接访问主存
DMA 访问路径直接访问主存直接访问主存
核心问题可能出现 CPU 和 DMA 之间的数据不一致性无缓存一致性问题
数据一致性需要硬件缓存一致性支持,或软件显式管理 失效/写回天然一致,无需特殊处理
性能CPU 访问速度快,Cache 命中时,但管理可能更加复杂CPU 访问速度相对较慢,每次都要访问主存,管理简单
典型用途通用内存数据传输设备寄存器、硬件内存映射、需要精确控制区域

总之,选用哪种方式取决于具体的应用需求:是需要利用 Cache 提高通用内存访问速度,还是需要避免缓存带来的复杂性和潜在一致性问题,确保直接、可靠的主存访问。

相关文章:

  • 服务器内存能不能用在台式机上
  • 网格布局示例代码解析
  • VSCode中PHP使用Xdebug
  • Easy系列PLC变频器控制功能块(ST源代码)
  • VsCode 离线插件下载
  • (1-6-5)Java 多线程(定长线程池)下载器(案例)
  • React 中的TypeScript开发范式
  • ubuntu桌面x11异常修复
  • 上位机开发过程中的设计模式体会(2):观察者模式和Qt信号槽机制
  • ubuntu + nginx 1.26 + php7.4 + mysql8.0 调优
  • 机器学习中的优化问题描述
  • Python列表:高效灵活的数据存储与操作指南
  • 讲讲JVM的垃圾回收机制
  • 基于大模型的输尿管下段结石诊疗全流程预测与方案研究
  • 项目课题——智能花盆系统设计
  • 核心机制:面向字节流
  • 业务:资产管理功能
  • Vim 调用外部命令学习笔记
  • 新一代 Rust Web 框架的高性能之选
  • 【数据结构】图算法(代码)
  • 企业建设网站的过程和预算表/商丘网站seo
  • 网站建设的程序/seo外链代发
  • 高唐做网站建设的公司/湖南seo优化报价
  • 保定网站建设解决方案/seo全网优化指南
  • 关注网站怎么做/seo关键字优化软件
  • 永康市网站建设/湖南长沙seo教育