当前位置: 首页 > wzjs >正文

php动态网站开发教材答案商城网站建设

php动态网站开发教材答案,商城网站建设,wordpress 充值系统,营销型网站建设策划书怎么写一、双精度着色器功能 1.1 WDDM 1.2双精度支持矩阵 graph LRA[功能级别11_0] -->|必须支持| B(基础双精度)A --> C[可选支持扩展指令]D[WDDM 1.2驱动] -->|硬件加速| E[FMA指令集]F[GPU架构] -->|Kepler/GCN1.0| D 在 Windows 8 中,支持双精度的 Win…

一、双精度着色器功能

1.1 WDDM 1.2双精度支持矩阵

graph LRA[功能级别11_0+] -->|必须支持| B(基础双精度)A --> C[可选支持扩展指令]D[WDDM 1.2驱动] -->|硬件加速| E[FMA指令集]F[GPU架构] -->|Kepler+/GCN1.0+| D

在 Windows 8 中,支持双精度的 Windows 显示驱动程序模型 (WDDM) 1.2 驱动程序还必须在所有着色器阶段支持高级着色器模型 5 中的其他双精度浮点指令。 说明如下:

  • 双精度倒数
  • 双精度除法
  • 双精度融合乘加

1.2 硬件能力检测流程

// 设备创建时检测
D3D11_FEATURE_DATA_DOUBLES featureDoubles;
pDevice->CheckFeatureSupport(D3D11_FEATURE_DOUBLES,&featureDoubles,sizeof(featureDoubles));// 着色器编译标志
D3DCOMPILE_ENABLE_STRICTNESS | D3DCOMPILE_IEEE_STRICTNESS

二、核心指令集实现

2.1 双精度运算指令规范

指令类型HLSL语法最小吞吐量要求(每时钟周期)
倒数rcp.double1 ops
除法div.double1 ops
融合乘加fma.double2 ops

2.2 精度控制参数

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\GraphicsDrivers\Precision]
"DoublePrecisionMode"=dword:00000001  // 0=宽松模式 1=IEEE严格模式

三、性能优化策略

3.1 指令级并行优化

// 优化前
double a = input.x;
double b = 1.0 / a;  // 单独倒数指令// 优化后(利用FMA)
double a = input.x;
double b = fma(a, -rcp(a), 1.0) * rcp(a);  // 牛顿迭代优化

3.2 内存访问模式

数据类型推荐对齐方式带宽利用率
double64字节边界98%
double2128字节边界100%
结构化缓冲区256字节跨距85%

四、企业级应用方案

4.1 科学计算可视化

注册表配置

[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Direct3D\Scientific]
"KeepDoublePrecision"=dword:00000001

4.2 金融数值模拟

// 蒙特卡洛模拟核函数
[numthreads(64,1,1)]
void CSMain(double3 input : SV_GroupThreadID)
{double sum = 0;for(int i=0; i<1000; i++){sum += fma(random(), input.x, input.y);  // 融合乘加加速}output[input.z] = sum;
}

五、兼容性验证

5.1 WHQL测试要求

测试项目精度容差性能阈值
倒数指令误差<4ULP10^9 ops/sec
FMA联合测试<2ULP15GB/s带宽
混合精度计算结果一致无性能回退

5.2 开发者自检清单

  1. 调用CheckFeatureSupport验证D3D11_FEATURE_DOUBLES
  2. 检查驱动版本≥WDDM 1.2
  3. 确认功能级别≥11_0
  4. 使用D3DCOMPILE_IEEE_STRICTNESS编译标志

5.3 核心资源

GPU架构rcp.ddiv.dfma.d
Kepler482
GCN 1.0361
Maxwell241

由于运行时可以将这些指令直接传递给驱动程序,因此实现可以优化其性能,或者将它们作为硬件中的专用单一指令实现。

注意 若要使用这些功能,开发人员必须确保它们在 WDDM 1.2 或更高版本驱动程序上以双精度支持 (D3D11_FEATURE_DOUBLES) FEATURE_LEVEL_11或更高版本运行。

六、绝对差异之和

图像处理是新式设备中的关键应用程序。 常见的操作是模式匹配或搜索。 视频编码操作通常搜索匹配的方块 (通常为 8x8 或 16x16) ,图像识别算法搜索由位掩码标识的更常规的形状。 为了提高这些方案的性能,Microsoft 高级着色器语言 (HLSL) 在所有着色器阶段中为着色器模型 5.0 添加了一个新的内部函数。 此内部 msad4 () 对应于并生成一组掩码的绝对差异之和, (MSAD) 着色器 IL 中的指令。 所有 WDDM 1.2 及更高版本的驱动程序都必须直接在硬件中支持此指令,或作为一组其他指令 (模拟) 。

注意 理想情况下,应实现 MSAD 指令,以便溢出导致饱和,而不是包装行为。 请注意,溢出行为未定义。

开发人员必须检查,以确保他们在 WDDM 1.2 或更高版本驱动程序上使用 FEATURE_LEVEL_11 或更高版本运行才能使用此功能。 开发人员不得依赖于溢出 (即高于 65535) 的累积值的结果准确性。

http://www.dtcms.com/wzjs/108067.html

相关文章:

  • 自己怎么给网站做优化站长工具果冻传媒
  • 学做网页设计seo公司上海
  • 深圳网站设计 建设元网址创建
  • web前端要求会哪些石家庄seo按天扣费
  • 购物网站建设模板图片seo关键词优化报价
  • 上海赶集网站建设网站推广入口
  • 成都网站设计网站南京百度
  • 哪家做网站做得好什么是网站推广优化
  • 高端网站开发公开课郑州模板建站代理
  • 购买东西网站怎么做品牌营销策略包括哪些内容
  • 用jsp做网站登录界面模板大连网络推广
  • 河南商丘网站站长之家素材网
  • 建网站资料营销型网站建设总结
  • 黄页号码认证广州seo培训
  • 个人网站设计论文摘要杭州市优化服务
  • 基于phpt漫画网站开发win7优化大师官网
  • 全国最大网站建站公司百度推广平台登录
  • opencart zencart网站建设陕西今日头条新闻
  • 武汉网站建设推广服务seo如何快速出排名
  • 什么网站可以做行测网站注册流程
  • 自己用笔记本做网站百度视频免费高清影视
  • 北京网站公司建设关键词爱站网
  • 免费卡盟网站建设核心关键词和长尾关键词
  • 网站建设要点最佳磁力吧ciliba
  • 做一个网站如何赚钱安卓优化大师下载安装
  • 博彩导航网站开发今日足球比赛分析推荐
  • 做c2b的网站品牌营销推广策划方案
  • 武汉设计网搜索引擎推广与优化
  • 做网站怎么认证微博东营百度推广公司
  • 网网站制作开发网站域名怎么注册