当前位置: 首页 > news >正文

[持续更新] HPC高性能计算CUDA/C++面试知识点

书籍相关

  • 《cuda c编程权威指南》
  • 《通用图形处理器设计——GPGPU编程模型与架构原理》

CUDA

CUDA知识点考察

  • cuda graph作用原理,kernel launch流程
  • cuda内存模型理解
  • 如何确定blocksize和gridsize
  • shared memor的bank conflict及解决方法
  • threadfence的作用
  • 如何debug cuda kernel
  • unified memory和zero-copy memory
  • cuda sort如何实现(涉及并行计算的特点+代码能力考察)
  • sin函数在哪个硬件计算,这个硬件还能算什么
  • Volat架构特性,ITS
  • 3090上单个block能用的shmem最大有多少
  • PTX与SASS的区别
  • GPU性能xx TFLOPS是怎么计算的

CUDA代码能力考察

CUDA实现尽量做到和C++实现做到bit对齐,有些公司会考察这个能力。

  • reduce
  • reduction
  • histogram
  • softmax
  • gemm,高性能计算方向大概率会问
  • scan
  • sort
  • matrix transpose
  • avg pooling
  • 算两堆bbox的iou
  • layernorm

C++

C++知识点考察

  • C++虚函数实现机制,单继承、多继承、虚继承的内存布局
  • 四种cast
  • 三种智能指针
  • 函数模板声明与定义能否分离
  • CRTP静态多态
  • vector扩容,resize和reserve

C++代码能力考察

  • leetcode top/hot 100
  • 单例模式
  • 生产者消费者模式
  • NMS
  • conv2d
  • 双线性插值(简化版有遇到过:对一维数组插值,就是只处理一行数据,比如8段lut插值成16段)
  • layernorm
http://www.dtcms.com/a/470271.html

相关文章:

  • 【有源码】基于Hadoop生态的大数据共享单车数据分析与可视化平台-基于Python与大数据的共享单车多维度数据分析可视化系统
  • 上海做网站推荐做景观要用的植物网站
  • 珠海 网站建设和推广万网网站空间
  • Jasperreport 导出word 多个element重叠部分导致不显示(不支持)
  • GRU(门控循环单元) 笔记
  • 莱州网站建设哪家好做网站要会哪些知识
  • ubuntu离线安装 xl2tpd
  • 如何在百度上做网站最好用的免费建站
  • 关联网站有那些wordpress超级排版器插件
  • 熊猫比分 APP:开启体育赛事观赛新“姿势”
  • 第二章:模块的编译与运行-9 Platform Dependency
  • java多模块概念
  • 小企业网站维护什么东西互联网培训
  • 找人做网站做的很烂网站自助建设推广
  • uhttpd HTTPS 在嵌入式与 OpenWrt 上的实战部署与排查
  • 合肥网站建设正规公司抖音如何推广引流
  • [cpprestsdk] 构建HTTP消息 | http_headers.h
  • SCI论文写作:从实验设计到发表(选题、文献调研、实验设计、数据分析、论文结构及语言规范)
  • 西安哪里有做网站的网页界面ps制作步骤
  • 《彻底理解C语言指针全攻略(2)》
  • JavaScript 性能优化实战:从原理到落地
  • 网上公司注册申请的流程江西短视频搜索seo推荐
  • 网站建设哪家好知道数字化档案馆及网站的建设
  • 汽车行业密钥灌装解决方案:构建可信的车载安全启动与通信体系
  • Vue2+Django TodoList项目跨域解决方案实战
  • 网页结构解析入门:HTML、CSS、JS 与爬虫的关系
  • Mac查看本机发出请求的IP地址
  • 《基于 YOLOv11 的武器装备视觉检测系统构建与专 利申请指南》
  • 云原生时代:微服务架构与Serverless实践指南
  • 3dgs Scene详解