当前位置: 首页 > news >正文

GPU高性能面试-写一个ReduceKernel

要求写一个reduceKernel 要求给出Kerne的完整调用:

1. 进行一维reduce

  1. 可以写一个最基础的,仅仅实现基础功能就行

  2. 使用share mem进行功能优化

  3. 使用shuffles指令完成block reduce操作

2.实现二维reduce

相关文章:

  • 微软10月补丁 | 修复103个漏洞,包括2个零日漏洞,13个严重漏洞
  • Google云平台构建数据ETL任务的最佳实践
  • 从零开始学习调用百度地图网页API:一、注册百度地图账号
  • SQL语句-中级
  • 深入promise
  • 苹果ios用户下载ipa文件内测签名的后的app应用下载安装到手机图标消失了-解决方案
  • SystemVerilog Assertions应用指南 第一章(1.25章节 “throughout”运算符)
  • 边端小场景音视频流分发架构
  • 【大数据】HBase入门指南
  • React知识点系列(8)-每天10个小知识
  • 数据特征选择 | Lasso特征选择(Python)
  • ElementUI--数据表格增删改查与表单验证
  • 数字IC/FPGA面试题目合集解析(一)
  • 机器学习-有监督学习-神经网络
  • Spring Boot中的Redis自动配置与使用
  • 消息称苹果或在明年推出搭载M3芯片的MacBook产品
  • XGBoost+LR融合
  • 如何使用JMeter测试导入接口/导出接口
  • frp隧道(流量代理)
  • uni-app:本地缓存的使用
  • 75岁亚当·费舍尔坐镇,再现80分钟马勒《第九交响曲》
  • 关税风暴下,3G资本拟94亿美元私有化美国鞋履巨头斯凯奇,溢价30%
  • 牛市早报|金融政策支持稳市场稳预期发布会将举行,商务部:中方决定同意与美方进行接触
  • 巴基斯坦军方:印度导弹袭击已造成至少3人死亡
  • 默茨当选德国总理
  • 文旅部:加强对景区索道、游船等设施设备安全隐患排查整治