当前位置: 首页 > wzjs >正文

网页设计制作网站总结产品软文范例大全

网页设计制作网站总结,产品软文范例大全,智能logo设计网站,湖北勘察设计协会网站一、CUDA核心概念 ‌Host与Device‌ ‌Host‌:CPU及其内存,负责控制流程和复杂逻辑‌。‌Device‌:GPU及其显存,专为并行计算设计,需通过PCIe总线与Host通信‌。 ‌Kernel函数‌ 用__global__修饰,在GPU上…

一、CUDA核心概念

  1. Host与Device

    • Host‌:CPU及其内存,负责控制流程和复杂逻辑‌。
    • Device‌:GPU及其显存,专为并行计算设计,需通过PCIe总线与Host通信‌。
  2. Kernel函数

    • __global__修饰,在GPU上并行执行的函数,通过<<<grid, block>>>语法指定线程规模‌。
  3. 线程层次结构

    • Thread‌:最小执行单元,通过threadIdx定位‌。
    • Block‌:包含多个线程(最多1024个),块内线程可共享内存(Shared Memory)并通过__syncthreads()同步‌。
    • Grid‌:多个Block的集合,通过blockIdx定位‌。
  4. 内存模型

    • 全局内存(Global Memory)‌:所有线程可访问,容量大但延迟高‌。
    • 共享内存(Shared Memory)‌:Block内共享,速度接近寄存器‌。
    • 常量内存 (Constant Memory):只读内存,适用于在内核执行期间不改变的值。访问速度较快(当所有线程访问相同地址时)。
    • 纹理内存 (Texture Memory):专门用于处理图像和纹理数据的只读内存。提供缓存机制,适合进行空间局部性访问。支持各种过滤和坐标变换。
    • 寄存器(Registers)‌:线程私有,访问最快‌。

二、CUDA编程步骤

  1. 环境配置

    • 安装CUDA Toolkit(如v11.8或更高)并验证nvidia-smi输出‌。
  2. 第一个CUDA程序,比如test.cu文件

    #include "cuda_runtime.h"
    #include "device_launch_parameters.h"
    #include <stdio.h>__global__ void vector_add(float *a, float *b, float *c, int size){int tid = blockIdx.x*blockDim.x + threadIdx.x;if(tid < size){c[tid] = a[tid] + b[tid];}
    }int main() {int size = 1000;float *a, *b, *c, *c_host;c_host = (float*)malloc(sizeof(float)*size);//设备内存分配cudaMalloc(&a, sizeof(float)*size);cudaMalloc(&b, sizeof(float)*size);cudaMalloc(&c, sizeof(float)*size);//初始化及数据传输float a_host[1000];float b_host[1000];int n = 0;for(n=0; n<size; n++){a_host[n] = 1.0;b_host[n] = 99.0;}cudaMemcpy(a,a_host,sizeof(float)*size,cudaMemcpyHostToDevice);cudaMemcpy(b,b_host,sizeof(float)*size,cudaMemcpyHostToDevice);//dim3 block(256); //每Block 256线程dim3 grid((size+256-1)/256);//计算所需Block数(这里根据size计算)vector_add<<<grid,block>>>(a,b,c,size);//结果回传到主机内存cudaMemcpy(c_host,c,sizeof(float)*size,cudaMemcpyDeviceToHost);cudaDeviceSynchronize();  // 等待GPU执行完成printf("host data head:%.2f tail:%.2f\n", c_host[0], c_host[size-1]);cudaFree(a);cudaFree(b);cudaFree(c);free(c_host);return 0;
    }

    编译命令:

    nvcc test.cu -o test
  3. 内存管理
    使用cudaMalloc分配设备内存,cudaFree释放设备内存。
    使用cudaMallocHost/malloc分配主机内存,使用cudaFreeHost/free释放主机内存。
    cudaMemcpy在Host与Device间传输数据‌。
    cudaMemcpy(deviceA, hostA, size, cudaMemcpyHostToDevice); 从主机到设备复制数据。
    cudaMemcpy(hostB, deviceB, size, cudaMemcpyDeviceToHost);从设备到主机复制暑假。


文章转载自:

http://sbeaE15c.sfwcb.cn
http://HRZGNeTo.sfwcb.cn
http://ZNafphkS.sfwcb.cn
http://3Yl9VWFN.sfwcb.cn
http://xA4oBSLj.sfwcb.cn
http://VWYCMyeD.sfwcb.cn
http://4cO85Ffk.sfwcb.cn
http://KJnmP9k8.sfwcb.cn
http://wMWxCqRP.sfwcb.cn
http://PipC7sY4.sfwcb.cn
http://oNbUcKwd.sfwcb.cn
http://TNiWqWHE.sfwcb.cn
http://H9gSyM0E.sfwcb.cn
http://xMuVJTKS.sfwcb.cn
http://rmUK2KbH.sfwcb.cn
http://qb9BcU9y.sfwcb.cn
http://7g2Tmkjm.sfwcb.cn
http://PpTyANLW.sfwcb.cn
http://pzgooyOG.sfwcb.cn
http://HmKAfAvt.sfwcb.cn
http://Ma92Jc4b.sfwcb.cn
http://ZMgV0aCp.sfwcb.cn
http://sgm6UO9p.sfwcb.cn
http://fXqDYT3v.sfwcb.cn
http://XA5buD8L.sfwcb.cn
http://BVnvbwhY.sfwcb.cn
http://aS4DLUOb.sfwcb.cn
http://t0UxHh0l.sfwcb.cn
http://Uqph0hvq.sfwcb.cn
http://55QkSty3.sfwcb.cn
http://www.dtcms.com/wzjs/701388.html

相关文章:

  • 小语种外贸网站做网站加推广
  • 网站做重新做_域名不换_空间想转到新网站这边工作细胞樱花动漫
  • 临汾万词霸屏网站建设免费咨询临汾网站建设
  • 设计师个人网站源码高端网站建设 j磐石网络
  • 云主机搭建asp网站建设教育培训的网站
  • 建设网站的标语达内培训网站开发
  • 广告投放网站重庆飘逸科技有限公司
  • 网站地址推荐台州律师网站建设
  • 做产品网站营销推广在国外做外国的网站合法吗
  • 企业网站建设变相收取等级保护费6商城网站建设源码
  • 做视频网站 投入怎样用自己的pid做搜索网站
  • 织梦行业网站模板哪个网站可以用MC皮肤做图片
  • 什么网站有女人跟狗做的网页开发者工具怎么用
  • 苏州自助建站模板邳州城乡建设局网站
  • 电商食品网站建设河北建设工程信息网天行建和园
  • 南京网站设计公司兴田德润电话多少软装设计风格
  • 网站建设专用名词互动平台罗马复兴
  • wordpress程序网站模板网页制作
  • 做网站用的动漫资料江苏省建设局报考网站
  • 长沙网站制作的seo优化博客
  • 做外贸有那些网站平台dedecms网站后台很卡
  • 做电影网站需要的服务器配置wordpress登录没链接
  • 黄图网站有哪些 推荐国内做钢铁的网站
  • 淘宝做图网站好蔡甸做网站
  • 网站备案组织机构代码泰安百度网站建设
  • 广东建设工程协会网站杭州百度推广开户
  • 福田网站建设效果凡科建站官网登
  • 建设部网站城建学院wordpress 登陆前台
  • 有没有在家做的兼职网站wordpress怎么给会员加上期限
  • 做网站ppt做网站编写