当前位置：首页 > news >正文

window 显示驱动开发-指定 GDI 硬件加速渲染操作

news 2025/11/3 14:07:14

调用 DxgkDdiRenderKm 函数时，操作系统指定要通过 pRenderKmArgs 参数执行的 GDI 硬件加速呈现操作的类型。 DirectX 图形内核子系统的显示端口驱动程序 (Dxgkrnl.sys) 将 pRenderKmArgs-pCommand> 成员设置为指向包含可变大小DXGK_RENDERKM_COMMAND结构数组的命令缓冲区。它还将 pRenderKmArgs-pCommandLength> 成员设置为命令缓冲区的大小（以字节为单位）。

驱动程序必须将输入DXGK_RENDERKM_COMMAND命令缓冲区转换为 DMA 缓冲区命令并生成修补程序位置列表。

DXGK_RENDERKM_COMMAND包含指定 GDI 硬件加速呈现操作的特征的成员，如下表所述。

呈现操作	DXGK_RENDERKM_COMMAND 成员	相应的DXGK_GDIARG_XXX结构	相应的DXGK_RENDERKM_OPERATION值
alpha 混合	AlphaBlend	DXGK_GDIARG_ALPHABLEND	DXGK_GDIOP_ALPHABLEND = 3
无拉伸的位块传输	BitBlt	DXGK_GDIARG_BITBLT	DXGK_GDIOP_BITBLT = 1
ClearType 和抗锯齿文本像素混合	ClearTypeBlend	DXGK_GDIARG_CLEARTYPEBLEND	DXGK_GDIOP_CLEARTYPEBLEND = 7
颜色填充	ColorFill	DXGK_GDIARG_COLORFILL	DXGK_GDIOP_COLORFILL = 2
拉伸位块传输	StretchBlt	DXGK_GDIARG_STRETCHBLT	DXGK_GDIOP_STRETCHBLT = 4
具有透明度的位块传输	TransparentBlt	DXGK_GDIARG_TRANSPARENTBLT	DXGK_GDIOP_TRANSPARENTBLT = 6

操作系统使用 DXGK_RENDERKM_COMMAND 的 OpCode 成员来指示显示微型端口驱动程序必须处理的特定 GDI 硬件加速呈现操作。 OpCode 成员的类型为 DXGK_RENDERKM_OPERATION，其值显示在表中。

操作系统还将提供 DXGK_RENDERKM_COMMAND CommandSize 成员的相应值，该值指定当前呈现命令的大小（以字节为单位），包括 OpCode 的值和命令中的子矩形数。

1. 核心流程

当 DxgkDdiRenderKm 被调用时，驱动程序需完成以下任务：

1.解析命令缓冲区：

输入：pRenderKmArgs->pCommand 指向 DXGK_RENDERKM_COMMAND 结构数组。

长度：pRenderKmArgs->CommandLength 指定缓冲区总大小（字节）。

2.转换命令：将 DXGK_RENDERKM_COMMAND 转换为 GPU 可执行的 DMA 缓冲区指令。

3.生成修补列表：为动态资源（如纹理、顶点缓冲区）生成修补位置列表（Patch Location List）

2. 命令结构：`DXGK_RENDERKM_COMMAND`

成员	类型	说明
`OpCode`	`UINT`	操作类型（如 `DXGK_GDIOP_BITBLT`、`DXGK_GDIOP_ALPHABLEND`）。
`CommandSize`	`UINT`	当前命令的总大小（字节，含附加数据）。
`Flags`	`UINT`	操作标志（如同步、缓存控制）。
`pDstRect`	`RECT*`	目标矩形（可选，依赖操作类型）。
`pSrcRect`	`RECT*`	源矩形（可选，如复制操作）。
`AdditionalData`	`BYTE[]`	附加数据（如像素格式、混合参数）

常见操作码（OpCode）：

DXGK_GDIOP_BITBLT：位块传输（传统 GDI 绘图）。
DXGK_GDIOP_ALPHABLEND：带 Alpha 混合的位块传输。
DXGK_GDIOP_STRETCHBLT：拉伸位块传输。
DXGK_GDIOP_CLEAR：填充矩形。

3. DMA 缓冲区生成与修补列表

(1) DMA 缓冲区要求
格式：必须符合 GPU 指令集架构（如 PM4、NVIDIA GPU 命令流）。

资源引用：

使用分配句柄（Allocation Handle）引用显存中的纹理/缓冲区。
动态地址需通过修补列表在提交前更新。

(2) 修补列表生成
作用：记录 DMA 缓冲区中需运行时修补的内存位置（如动态纹理地址）。

示例伪代码：

typedef struct {D3DGPU_VIRTUAL_ADDRESS GpuVa;  // GPU 虚拟地址UINT PatchOffset;              // DMA 缓冲区中的偏移量
} PATCH_LOCATION;VOID GeneratePatchList(DXGK_RENDERKM_COMMAND* pCmd, PATCH_LOCATION* pList) {if (pCmd->OpCode == DXGK_GDIOP_BITBLT) {pList[0].GpuVa = GetTextureGpuVa(pCmd->AdditionalData);pList[0].PatchOffset = dmaBufferOffset + 0x10; // 示例偏移}
}

4. 分阶段处理（MultipassOffset 复用）

若命令缓冲区过大，需分多次处理：

保存进度：

高16位：已处理的命令缓冲区偏移量。
低16位：当前命令的子操作状态。

继续处理：下次调用时从 MultipassOffset 恢复进度。

示例：

UINT processedBytes = pRenderKmArgs->MultipassOffset >> 16;
while (processedBytes < pRenderKmArgs->CommandLength) {DXGK_RENDERKM_COMMAND* pCmd = (DXGK_RENDERKM_COMMAND*)((BYTE*)pRenderKmArgs->pCommand + processedBytes);if (!ConvertToDmaBuffer(pCmd, ...)) {// 更新进度并请求更多 DMA 缓冲区空间pRenderKmArgs->MultipassOffset = (processedBytes << 16) | currentSubOp;return STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER;}processedBytes += pCmd->CommandSize;
}

5. 错误处理

状态码	场景
`STATUS_SUCCESS`	所有命令成功转换并提交。
`STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER`	DMA 缓冲区空间不足（需分阶段处理）。
`STATUS_INVALID_PARAMETER`	非法命令或参数（如无效矩形）。