当前位置: 首页 > news >正文

CUDA 13.0 中 CCCL 2.x 到 CCCL 3.0 迁移介绍

来自于页面:CCCL 2.x ‐ CCCL 3.0 migration guide — CUDA Core Compute Libraries

CCCL是NVIDIA推出的CUDA C++开发者核心工具库,整合了Thrust、CUB、libcudacxx等多个高性能库,旨在为CUDA环境下的C++开发提供统一、高效的工具链

核心组件​:

  • libcu++​​:CUDA环境下的C++标准库实现,支持主机与设备端无缝运行,提供高级同步原语、精细缓存控制、原子操作优化等功能,简化跨设备代码开发

  • CUB​:底层并行算法库,针对GPU架构优化,提供块级(Block-wide)规约、束级(Warp-wide)扫描等底层原语,适合极致性能的自定义内核开发

  • Thrust​:高层并行算法库,类似C++ STL,提供简洁的接口(如transform_reducesort),支持多后端(CUDA、TBB、OpenMP),适合快速原型开发与跨平台部署

CUDA升级到13.0后,CCCL也会升级到3.0,使用的代码需要进行迁移,遇到的主要修改有:

  • 头文件包含修改

CUDA 13.0 之前

CUDA 13.0 之后

${CTK_ROOT}/include/cuda/

${CTK_ROOT}/include/cccl/cuda/

${CTK_ROOT}/include/cub/

${CTK_ROOT}/include/cccl/cub/

${CTK_ROOT}/include/thrust/

${CTK_ROOT}/include/cccl/thrust/

官方说明不要修改代码中头文件路径增加<cccl/>,而是使用增加编译参数的方式 -I${CTK_ROOT}/include/cccl

  • 调用接口修改

CUDA 13.0 之前

CUDA 13.0 之后

cub::Max

cuda::maximum

cub::max

cuda::std::max

cub::Min

cuda::minimum

cub::min

cuda::std::min

cub::Sum

cuda::std::plus

cuda::maximum 可以在文件 include/cccl/cuda/__functional/maximum.h 查看

cuda::minimum 可以在文件 include/cccl/cuda/__functional/minimum.h 查看

cuda::std::max 在文件 include/cccl/cuda/std/detail/libcxx/include/algorithm 查看

cuda::std::min 在文件 include/cccl/cuda/std/detail/libcxx/include/algorithm 查看

cuda::std::plus 在文件 include/cccl/cuda/std/__functional/operations.h 查看

如果升级到CUDA 13.0后使用CCCL还有其他问题,可以在CCCL 2.x ‐ CCCL 3.0 migration guide — CUDA Core Compute Libraries查找对应的调用是否要替换或移除

http://www.dtcms.com/a/438493.html

相关文章:

  • 临沂企业网站建设网站建设 技术方案
  • 《计算机视觉度量:从特征描述到深度学习》-- 基于MAE预训练模型DinoV3的图像特征分析
  • LabVIEW继电保护检测
  • 网站开发网公司营业执照查询
  • dedecms视频网站开发wordpress弃用react
  • Unity Profiler中的LogStringToConsole
  • 开源的intellij ide 的claude code 插件和codex 插件
  • 深度学习图像分类实战:从零构建ResNet50多类别分类系统
  • 网站建设报价选兴田德润专业的建站公司推广
  • springboot+vue图书借阅管理系统设计(源码+文档+调试+基础修改+答疑)
  • 大学生兼职网站设计论文做网站大公司有哪些
  • 四川省建设厅官方网站联系电话南京电商代运营
  • 打破信息差——miniQMT
  • B站评论爬虫实战:从数据获取到情感分析
  • jsp网站 值班linux做网站用什么语言
  • 环保网站模板 html深圳福田网站建设
  • Leetcode 3694. Distinct Points Reachable After Substring Removal
  • LeetCode:87.最长递增子序列
  • 突破性联邦学习项目:基于KAN-ResNet的胎儿发育预测系统 - 隐私保护与高效训练完美结合
  • SpringBoot项目优先级以及bean的管理
  • 厦门建站系统建设新年贺卡图片 手工制作
  • 怎么自己做视频网站制作网站协议
  • 从0死磕全栈之Next.js App Router动态路由详解:从入门到实战
  • RAG 入门全流程代码实战
  • Simulink模型转NuSMV模型(2006)
  • 内蒙古网站建设百度网站建设以什么盈利
  • 工业网站建设wordpress设置新浪邮箱
  • WSDL 文档:理解与使用
  • 网站建设丨金手指15设计师联盟官网效果图
  • Python3 MongoDB 使用指南