当前位置: 首页 > wzjs >正文

西宁做网站的网络公司wordpress 优享

西宁做网站的网络公司,wordpress 优享,大连科技学院官方网站的建设与放,网站开发维护公司nvcc hello.cu -archcompute_60 -codesm_60 1、指定虚拟架构计算能力 1、c/c源码编译为PTX时,可以指定虚拟架构的计算能力,用来确定代码中能够使用的CUDA功能 2、c/c源码转换为PTX这一步骤与GPU硬件无关 3、编译指令: -archcompute_XY //X…
nvcc hello.cu -arch=compute_60 -code=sm_60

1、指定虚拟架构计算能力

        1、c/c++源码编译为PTX时,可以指定虚拟架构的计算能力,用来确定代码中能够使用的CUDA功能

        2、c/c++源码转换为PTX这一步骤与GPU硬件无关

        3、编译指令:

-arch=compute_XY  //XY:第一个数字X代表计算能力的主版本号,第二个数字Y代表计算能力的次版本号

        4、PTX的指令只能在更高的计算能力的GPU使用

//下面指令编译出的可执行文件helloword可以在计算能力>=6.1的gpu上面执行,在计算能力校友6.1的gpu则不能执行。
ncvv helloworld.cu -o helloworld -arch=compute_61

2、制定真实架构计算能力

        1、PTX指令转化为二进制cubin代码与具体的gpu架构有关

        2、编译指令

-code=xm_XY  //XY:第一个数字代表计算能力的主版本号,第二个数字Y代表计算能力的次版本号

        注意:

                1、二进制cubin代码,大版本之间不兼容

                2、指定真实架构计算能力的时候必须指定虚拟架构计算能力

                3、指定的真实架构能力必须大于或等于虚拟架构能力

        3、真实架构可以实现低小版本到高小版本的兼容 

3、指定多个gpu版本编译

        1、使得编译出来的可执行文件可以在多gpu中执行

        2、同时指定多组计算能力:

编译选项:-gencode arch=compute_XY -code=sm_XY
nvcc ex1.cu -o ex1_fat -gencode arch=compute_35,code=sm_35   //开普勒架构-gencode arch=compute_50,code=sm_50  //麦克斯韦架构-gencode arch=compute_60,code=sm_60  //帕斯卡架构-gencode arch=compute_70,code=sm_70  //伏特架构

        3、编译出的可执行文件包含4个二进制版本,生成的可执行文件称为胖二进制文件

        4、注意:

                1、执行上述指令必须CUDA版本支持7.0计算能力,否则会报错

                2、过多指定计算能力,会增加编译时间和可执行文件的大小

4、nvcc即时编译

        1、在运行可执行文件时,从保留的PTX代码临时编译出cubin文件,可以实现在高版本的gpu运行在低版本的程序

        2、在可执行文件中保留PTX代码,nvcc编译指令指定所保留的PTX代码虚拟架构:

-gencode arch=compute_XY,code=compute_XY

                注意:       

                        1、两个计算能力都是虚拟架构计算能力

                        2、两个虚拟架构计算能力必须一致        

        3、例:

nvcc ex1.cu -o ex1_fat -gencode arch=compute_35,code=sm_35   -gencode arch=compute_50,code=sm_50  -gencode arch=compute_61,code=sm_61  -gencode arch=compute_61,code=compute_61  

5、nvcc编译默认计算能力

        1、不同版本CUDA编译器在编译CUDA代码时,都有一个默认计算能力

        2、 cuda6.0及更早版本:        默认计算能力1.0

              cuda6.5~~cuda8.0:          默认计算能力2.0

               cuda9.0~~cuda10.0:        默认计算能力3.0

               cuda11.6:                         默认计算能力5.2  

http://www.dtcms.com/wzjs/578226.html

相关文章:

  • 做网站用什么配置笔记本如何做一个简单的网站
  • 网站logo做黑页wordpress使用模板
  • 做微商有卖鞋子的网站吗青岛市建设工程信息网官网
  • 个人网站 摄影展示大连市网站制作电话
  • 做网站的人多吗荆门网站开发有哪些
  • 公司网站建设费维护费会计分录徐州网站建设案例
  • 营销型企业网站功能西安网站开发外包公司有
  • 温州高端品牌网站建设263邮箱注册
  • 绍兴网站制作多少钱个人怎么制作网站
  • 怎样做已有网站的编辑维护wordpress如何配置伪静态
  • 外观设计网站谷歌seo优化技巧
  • 福州网站建设技术支持网站的设计风格
  • 欧美企业网站模板西安官网seo哪家公司好
  • 房产类网站建设单页网站内链接
  • 自己做的网站邮箱更改密码程序为什么总出错搜索引擎优化到底是优化什么
  • 那个网站可以做攻略2021年建站赚钱
  • 平面设计作品集如何制作网站优化快照
  • 都昌县建设局网站微信公众平台登录入口官网
  • 有谁知道知乎网站是谁做的中国铁建最新消息
  • 18互联网站做网站程序官方网站如何建立
  • 上海网站开发前十名网站网站注册
  • 网站如何进行推广佛山市品牌网站建设价格
  • 域名空间都有了怎么做网站目前做外贸的网站哪个比较好
  • 做百度微信小程序都有哪些网站合肥免费做网站
  • 昆明网站建设yn119机械设备东莞网站建设
  • 精美 企业网站模板淮安市哪里可以做网站
  • 厦门网站设计公司排名衡水网页网站建设
  • 明星粉丝网站怎么做wordpress推广码
  • 免费领手机 网站商丘电子商务网站建设
  • 网站推广软文代发舆情监控一般多少钱