window 显示驱动开发-指定 GDI 硬件加速渲染操作
调用 DxgkDdiRenderKm 函数时,操作系统指定要通过 pRenderKmArgs 参数执行的 GDI 硬件加速呈现操作的类型。 DirectX 图形内核子系统的显示端口驱动程序 (Dxgkrnl.sys) 将 pRenderKmArgs-pCommand> 成员设置为指向包含可变大小DXGK_RENDERKM_COMMAND结构数组的命令缓冲区。 它还将 pRenderKmArgs-pCommandLength> 成员设置为命令缓冲区的大小(以字节为单位)。
驱动程序必须将输入DXGK_RENDERKM_COMMAND命令缓冲区转换为 DMA 缓冲区命令并生成修补程序位置列表。
DXGK_RENDERKM_COMMAND包含指定 GDI 硬件加速呈现操作的特征的成员,如下表所述。
呈现操作 | DXGK_RENDERKM_COMMAND 成员 | 相应的DXGK_GDIARG_XXX结构 | 相应的DXGK_RENDERKM_OPERATION值 |
---|---|---|---|
alpha 混合 | AlphaBlend | DXGK_GDIARG_ALPHABLEND | DXGK_GDIOP_ALPHABLEND = 3 |
无拉伸的位块传输 | BitBlt | DXGK_GDIARG_BITBLT | DXGK_GDIOP_BITBLT = 1 |
ClearType 和抗锯齿文本像素混合 | ClearTypeBlend | DXGK_GDIARG_CLEARTYPEBLEND | DXGK_GDIOP_CLEARTYPEBLEND = 7 |
颜色填充 | ColorFill | DXGK_GDIARG_COLORFILL | DXGK_GDIOP_COLORFILL = 2 |
拉伸位块传输 | StretchBlt | DXGK_GDIARG_STRETCHBLT | DXGK_GDIOP_STRETCHBLT = 4 |
具有透明度的位块传输 | TransparentBlt | DXGK_GDIARG_TRANSPARENTBLT | DXGK_GDIOP_TRANSPARENTBLT = 6 |
操作系统使用 DXGK_RENDERKM_COMMAND 的 OpCode 成员来指示显示微型端口驱动程序必须处理的特定 GDI 硬件加速呈现操作。 OpCode 成员的类型为 DXGK_RENDERKM_OPERATION,其值显示在表中。
操作系统还将提供 DXGK_RENDERKM_COMMAND CommandSize 成员的相应值,该值指定当前呈现命令的大小(以字节为单位),包括 OpCode 的值和命令中的子矩形数。
1. 核心流程
当 DxgkDdiRenderKm 被调用时,驱动程序需完成以下任务:
1.解析命令缓冲区:
输入:pRenderKmArgs->pCommand 指向 DXGK_RENDERKM_COMMAND 结构数组。
长度:pRenderKmArgs->CommandLength 指定缓冲区总大小(字节)。
2.转换命令:将 DXGK_RENDERKM_COMMAND 转换为 GPU 可执行的 DMA 缓冲区指令。
3.生成修补列表:为动态资源(如纹理、顶点缓冲区)生成修补位置列表(Patch Location List)
2. 命令结构:DXGK_RENDERKM_COMMAND
成员 | 类型 | 说明 |
---|---|---|
OpCode | UINT | 操作类型(如 DXGK_GDIOP_BITBLT 、DXGK_GDIOP_ALPHABLEND )。 |
CommandSize | UINT | 当前命令的总大小(字节,含附加数据)。 |
Flags | UINT | 操作标志(如同步、缓存控制)。 |
pDstRect | RECT* | 目标矩形(可选,依赖操作类型)。 |
pSrcRect | RECT* | 源矩形(可选,如复制操作)。 |
AdditionalData | BYTE[] | 附加数据(如像素格式、混合参数) |
常见操作码(OpCode):
- DXGK_GDIOP_BITBLT:位块传输(传统 GDI 绘图)。
- DXGK_GDIOP_ALPHABLEND:带 Alpha 混合的位块传输。
- DXGK_GDIOP_STRETCHBLT:拉伸位块传输。
- DXGK_GDIOP_CLEAR:填充矩形。
3. DMA 缓冲区生成与修补列表
(1) DMA 缓冲区要求
格式:必须符合 GPU 指令集架构(如 PM4、NVIDIA GPU 命令流)。
资源引用:
- 使用 分配句柄(Allocation Handle) 引用显存中的纹理/缓冲区。
- 动态地址需通过 修补列表 在提交前更新。
(2) 修补列表生成
作用:记录 DMA 缓冲区中需运行时修补的内存位置(如动态纹理地址)。
示例伪代码:
typedef struct {D3DGPU_VIRTUAL_ADDRESS GpuVa; // GPU 虚拟地址UINT PatchOffset; // DMA 缓冲区中的偏移量
} PATCH_LOCATION;VOID GeneratePatchList(DXGK_RENDERKM_COMMAND* pCmd, PATCH_LOCATION* pList) {if (pCmd->OpCode == DXGK_GDIOP_BITBLT) {pList[0].GpuVa = GetTextureGpuVa(pCmd->AdditionalData);pList[0].PatchOffset = dmaBufferOffset + 0x10; // 示例偏移}
}
4. 分阶段处理(MultipassOffset 复用)
若命令缓冲区过大,需分多次处理:
保存进度:
- 高16位:已处理的命令缓冲区偏移量。
- 低16位:当前命令的子操作状态。
继续处理:下次调用时从 MultipassOffset 恢复进度。
示例:
UINT processedBytes = pRenderKmArgs->MultipassOffset >> 16;
while (processedBytes < pRenderKmArgs->CommandLength) {DXGK_RENDERKM_COMMAND* pCmd = (DXGK_RENDERKM_COMMAND*)((BYTE*)pRenderKmArgs->pCommand + processedBytes);if (!ConvertToDmaBuffer(pCmd, ...)) {// 更新进度并请求更多 DMA 缓冲区空间pRenderKmArgs->MultipassOffset = (processedBytes << 16) | currentSubOp;return STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER;}processedBytes += pCmd->CommandSize;
}
5. 错误处理
状态码 | 场景 |
---|---|
STATUS_SUCCESS | 所有命令成功转换并提交。 |
STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER | DMA 缓冲区空间不足(需分阶段处理)。 |
STATUS_INVALID_PARAMETER | 非法命令或参数(如无效矩形)。 |
6. 性能优化建议
命令批处理:合并多个 DXGK_RENDERKM_COMMAND 到单个 DMA 缓冲区以减少提交开销。静态命令缓存:缓存常用操作(如清屏)的 DMA 缓冲区片段。
异步修补:若硬件支持,在另一个线程中预生成修补列表。
7. 调试与验证
WDK 工具:使用 !dxgkdio.dumpcommand 内核调试器扩展解析命令缓冲区。
日志记录:记录 OpCode 和 CommandSize 以验证命令流完整性。
8. 总结
输入:DXGK_RENDERKM_COMMAND 数组描述 GDI 操作。
输出:DMA 缓冲区 + 修补列表,供 GPU 执行。
关键点:
- 正确处理 MultipassOffset 以支持大型命令缓冲区。
- 修补列表确保动态资源地址正确绑定。