当前位置: 首页 > news >正文

浅析PCIe 6.0 ATS地址转换功能

在现代高性能计算和虚拟化系统中,地址转换(Address Translation)是一个至关重要的机制。随着 PCIe 设备(如 GPU、网卡、存储控制器)直接访问系统内存的能力增强,设备对虚拟内存的访问需求日益增长。

图片

为了提升性能并确保安全访问,Address Translation Services(ATS) 应运而生。

图片

ATS 是 PCIe 规范中的一项关键功能,允许设备(如 Endpoint)在访问内存时自行进行虚拟地址到物理地址的转换,而无需依赖 CPU 的 MMU(Memory Management Unit)或操作系统介入。这不仅提升了性能,也增强了设备的自主性和安全性。

图片

在早期的 PCIe 架构中,设备(如网卡或存储设备)只能通过 DMA(Direct Memory Access)访问物理地址。这意味着设备必须依赖主机(Host)为它分配物理地址,或者由操作系统进行地址映射。

图片

这种方式存在以下问题:

  • 性能瓶颈

    :每次地址转换都需要主机介入,导致延迟增加。

  • 虚拟化支持差

    :在虚拟化环境中,多个虚拟机共享同一个物理设备,传统的物理地址访问方式难以满足隔离和安全需求。

  • 资源浪费

    :需要为每个虚拟机预留连续的物理内存区域。

扩展阅读:

浅析CXL P2P DMA加速数据传输的原理

PCIe P2P DMA全景解读

深度剖析:DMA对PCIe数据传输性能的影响

《存储IO路径》专题:数据魔法师DMA

为了解决上述问题,PCIe 3.0 引入了 Address Translation Services(ATS)。ATS 允许设备在访问内存时,使用虚拟地址,并通过 IOMMU(Input/Output Memory Management Unit)进行地址转换。设备可以缓存转换结果(ATC,Address Translation Cache),从而减少频繁的转换请求,提高性能。

图片

ATS 的实现依赖于以下关键组件:

组件

描述

IOMMU

输入/输出内存管理单元,负责将设备的虚拟地址转换为物理地址。

MMU

CPU 的内存管理单元,负责将 CPU 的虚拟地址转换为物理地址。

Translation Agent (TA)

负责处理 ATS 转换请求的实体,可以是 IOMMU 或 MMU。

Address Translation Cache (ATC)

设备内部缓存地址转换结果的结构,类似于 CPU 的 TLB。

Address Translation Protection Table (ATPT)

存储地址转换信息的数据结构,由 TA 使用。

图片

设备发起转换请求(Translation Request): 设备(如 Endpoint)向 Root Complex(RC)发送 ATS Translation Request,请求将虚拟地址转换为物理地址。请求中包含虚拟地址、PASID(Process Address Space Identifier)、访问权限等信息。

图片

Root Complex 转发请求至 Translation A

http://www.dtcms.com/a/297472.html

相关文章:

  • 小白如何认识并处理Java异常?
  • C++ 多线程同步机制详解:互斥锁、条件变量与原子操作
  • VSCode——python选择解释器消失的解决办法
  • 最近邻规则分类KNN,原理,k值选择优化,kd树优化,以及iris数据集分类
  • JS与Go:编程语言双星的碰撞与共生
  • RocketMQ学习系列之——客户端消息确认机制
  • Lakehouse x AI ,打造智能 BI 新体验
  • 不同场景下的向量数据库选择:知识库、知识图谱与推荐系统
  • java面试题(一)
  • 【blender小技巧】使用blender实现图转换为3D模型,并进行模型网格优化减面操作
  • html消息提示框封装,默认,失败,警告,成功四个状态
  • PPIO上线阿里旗舰推理模型Qwen3-235B-A22B-Thinking-2507
  • CodeSmith从SqlServer生成符合StyleCop规范的实体类
  • AI浪潮涌,数据库“融合智能”奏响产业新乐章
  • 【无标题】qwen3-8b 强化学习训练后的模型,可以接着 进行其他grpo 强化学习训练 吗
  • XCTF-crypto-幂数加密
  • vue3 组件生命周期,watch和computed
  • 腾讯云代码助手使用指南
  • 【调试Bug】网络在训练中输出NaN
  • 工业与安防视频场景下,如何选择更合适的音视频技术方案
  • 创建 GitLab Runner 使用CICD自动化部署容器
  • 2025 Gitee vs. GitLab:全面对比与选择指南
  • MyBatis高级应用实战指南
  • JAVA + 海康威视SDK + FFmpeg+ SRS 实现海康威视摄像头二次开发
  • RWA的法律合规性如何保证?KYC/AML在RWA项目中的作用是什么?
  • 关于回归决策树CART生成算法中的最优化算法详解
  • AWS CAF:企业云转型的战略指南
  • 飞行控制领军者 | 边界智控携高安全级飞控系统亮相2025深圳eVTOL展
  • 多租户系统中的安全隔离机制设计
  • Spring 生态创新应用:现代架构与前沿技术实践