当前位置：首页 > news >正文

window 显示驱动开发-命令和 DMA 缓冲区简介

news 2025/10/20 5:01:51

命令和 DMA 缓冲区非常相似。但是，命令缓冲区由用户模式显示驱动程序使用，DMA 缓冲区由显示微型端口驱动程序使用。

命令缓冲区具有以下特征：

它永远不会由 GPU 直接访问。
硬件供应商控制格式。
它从呈现应用程序的专用地址空间中的常规可分页内存中为用户模式显示驱动程序分配。

DMA 缓冲区具有以下特征：

它基于命令缓冲区的已验证内容。
它由显示微型端口驱动程序从内核可分页内存中分配。
在 GPU 可以从 DMA 缓冲区读取数据之前，显示微型端口驱动程序必须对 DMA 缓冲区进行分页锁定，并通过光圈映射 DMA 缓冲区。

命令缓冲区 vs DMA 缓冲区的对比

特性	命令缓冲区 (Command Buffer)	DMA缓冲区 (DMA Buffer)
使用者	用户模式显示驱动程序(UMD)	显示微型端口驱动程序(KMD)
内存位置	用户空间的可分页内存	内核空间的可分页内存
GPU访问方式	不直接访问，需转换为DMA缓冲区	通过光圈映射后GPU直接读取
内存管理	由UMD分配和管理	由视频内存管理器(VidMm)分配，KMD转换
验证要求	无硬件验证	必须通过KMD验证
生命周期	短暂存在，提交后即可释放	需保持到GPU执行完成

详细工作流程

命令生成阶段

// 用户模式驱动(UMD)生成命令
void UmdGenerateCommands() {BYTE* cmdBuffer = AllocUserPagedMemory();  // 分配用户空间可分页内存// 填充硬件特定命令格式WriteDrawCommand(cmdBuffer, ...);WriteTextureBind(cmdBuffer, ...);pfnSubmitCommand(cmdBuffer);  // 提交到运行时
}

验证与转换阶段

// 内核模式驱动(KMD)处理
NTSTATUS KmdProcessCommands(BYTE* userCmdBuffer) {// 1. 验证命令安全性if (!ValidateCommands(userCmdBuffer)) return STATUS_ACCESS_VIOLATION;// 2. 分配DMA缓冲区DMA_BUFFER* dmaBuffer = VidMmAllocateDmaBuffer(); // 3. 转换并复制命令TranslateToHardwareFormat(userCmdBuffer, dmaBuffer);// 4. 锁定内存并映射光圈MmPageLockBuffer(dmaBuffer);MapToAperture(dmaBuffer);// 5. 提交到GPU队列DxgkDdiSubmitCommand(dmaBuffer);
}

GPU执行阶段

关键设计考量

安全隔离机制

用户模式命令缓冲区无法直接访问硬件，必须通过内核验证
DMA缓冲区地址对用户模式不可见，防止恶意修改

性能优化

命令批处理：UMD可累积多个命令后一次性提交
内存复用：DMA缓冲区常采用环形缓冲区(Ring Buffer)设计
异步提交：KMD使用DMA引擎并行处理多个缓冲区

错误处理

// 典型错误检测点
void ValidateCommands(BYTE* cmdBuffer) {if (cmdBuffer->textureHandle == INVALID_HANDLE)ThrowException("无效纹理句柄");if (cmdBuffer->shaderCodeSize > MAX_SHADER_SIZE)ThrowException("着色器代码过大");
}

多引擎支持；现代GPU可能有多个DMA队列：

3D渲染队列
计算队列
拷贝引擎队列

每个队列需要独立的DMA缓冲区管理

实际开发注意事项

用户模式驱动开发

// 良好实践示例
struct CommandHeader {DWORD engineType;  // 指定GPU引擎类型DWORD size;        // 命令总大小DWORD fenceId;     // 用于同步的标识
};void SubmitRenderCommands() {CommandHeader* header = (CommandHeader*)AllocCommandBuffer();header->engineType = ENGINE_3D;header->fenceId = GenerateFenceId();// 填充具体命令...EmitDrawPrimitive(header+1, ...);// 提交时包含元数据pfnSubmitCommandEx(header, sizeof(CommandHeader)+payloadSize);
}

内核模式驱动开发

// DMA缓冲区处理示例
void HandleDmaBuffer(DMA_BUFFER* buffer) {// 确保内存有效if (!MmIsBufferValid(buffer)) {DbgPrint("无效DMA缓冲区地址");return STATUS_INVALID_PARAMETER;}// 硬件特定处理if (IsAmdGpu()) {ApplyAmdWorkaround(buffer);}// 添加至执行队列InsertToRingBuffer(g_CommandRing, buffer);
}

调试技巧

捕获命令缓冲区

# 使用PIX工具捕获
pixcap -start -cmd -out trace.wpix

检查DMA状态

# WinDbg扩展命令
!dxgkd_ext.dmabuffer 0xFFFFFA8001234560

性能分析标记

// 在命令中插入调试标记
#define DBG_MARKER 0xDEADBEEF
*(DWORD*)(cmdPtr+offset) = DBG_MARKER;

演进趋势

GPU虚拟内存：现代GPU支持虚拟地址空间，DMA缓冲区可直接引用GPU虚拟地址而非物理地址
直接提交优化：Windows 11引入DirectSubmission模式，允许特定条件下绕过部分验证
跨进程共享：DX12支持跨进程命令缓冲区共享，但需额外安全审查

理解这些底层机制对于开发高性能图形应用、调试复杂渲染问题以及优化驱动程序性能都至关重要。实际开发中应结合WDK文档和硬件厂商的特定指南进行实现。

查看全文

http://www.dtcms.com/a/192217.html

生成式AI在编程中的应用场景：从代码生成到安全检测

Java转Go日记（三十六）：简单的分布式

LeetCode 热题 100 437. 路径总和 III

Day118 | 灵神 | 二叉树 | 删点成林

详解 Zephyr RTOS：架构、功能与开发指南

Makefile 在 Go 项目中的实践

养生：打造健康生活的四大支柱

和为target问题汇总

低分辨率运行安卓模拟器：

商业架构 2.0 时代：ZKmall开源商城前瞻性设计如何让 B2B2C 平台领先同行 10 年？

mock 数据（ json-server ）

【Spring Cloud Gateway】Nacos整合遇坑记：503 Service Unavailable

【上位机——WPF】App.xml和Application类简介

【微服务】SpringBoot + Docker 实现微服务容器多节点负载均衡详解

【FileZilla】Client端的线程模型 (一)

python-修改图片背景色

Missashe考研日记—Day37-Day43

力扣310.最小高度树(拓扑排序，无向图)，力扣.加油站力扣.矩阵置零力扣.二叉树中的最大路径和

如何在Firefox火狐浏览器里-安装梦精灵AI提示词管理工具

计网实验（四）CS144 Lab4

【技术原理】Linux 文件时间属性详解：Access、Modify、Change 的区别与联系

2025年5月华为H12-821新增题库带解析

React学习———Redux 、 React Redux和react-persist

分布式AI推理的成功之道

20250515通过以太网让VLC拉取视熙科技的机芯的rtsp视频流的步骤

RK3588 桌面系统配置WiFi和蓝牙配置

1、数据结构与算法(Python版-啃书)-绪论

前端流行框架Vue3教程：16. 组件事件配合`v-model`使用

【Java ee初阶】http（1）

左手坐标系、右手坐标系、坐标轴方向

详细工作流程

关键设计考量

实际开发注意事项

调试技巧

演进趋势

相关文章：