当前位置：首页 > news >正文

NDRange（OpenCL）和 Grid/Block（CUDA）对比

news 2025/10/15 18:34:24

在 OpenCL 和 CUDA 中，NDRange（OpenCL）和 Grid/Block（CUDA）都是用于定义并行执行层次的抽象概念，但它们的术语和具体实现略有不同。以下是对比表格和详细说明：

OpenCL (NDRange)	CUDA (Grid/Block)	关系说明
Global Work Size	Grid	全局工作项总数，对应 CUDA 的 Grid 中所有线程总数。
Local Work Size	Block	工作组大小，对应 CUDA 的 Block 中线程数。
Work-Item	Thread	最小执行单元（一个线程）。
Work-Group	Block	一组工作项（线程），共享本地内存（OpenCL 的 `__local` / CUDA 的 `__shared__`）。
NDRange Offset	无直接对应	OpenCL 支持全局工作项的偏移，CUDA 通常通过计算线程索引实现偏移。

OpenCL:

cpp

cl::NDRange global(1024);  // 1024 个工作项
cl::NDRange local(128);    // 每组

ngx_http_referer_module 模块概述

HTTPS的工作过程

2025/5/18

水平可见直线--上凸包（andrew算法

【方法论】如何构建金字塔框架

Cursor：简单三步提高生成效率

学习黑客HTTP 请求头

【QGIS二次开发】地图编辑-06

算法篇----二分查找

k8s备份namespace

TDengine 在新能源领域的价值

限流算法 + dfa敏感词过滤算法