当前位置: 首页 > news >正文

昇思学习营-昇思+香橙派+deepseek介绍课程内容及心得

DeepSeek V3/R1轰动全球,带动模型结构和训练方式转变,包含下面三个方面:

  • MoE模型结构成为业界主流和后续模型的标准配置
  • 类o1/R1慢思考模型
  • 大模型开发框架中的预训练、后训练、推理部署环节
      1. 自研模型的moe结构
      2. 自研模型的强化学习
      3. 推理场景下的数据蒸馏及模型吞吐等

昇思MindSpore 2.6框架支持DeepSeek V3/R1 MoE等结构及自研模型特性及昇思mindspore2.6框架的基础结构和cann之间的关系

  1. 高性能MOE预训练,性能提升30%
  2. 类R1高性能推理,吞吐提升2.8x
  3. 易用性提升,SOTA模型Day0迁移
  4. 后训练强化学习套件,训推一体
  5. AI+科学计算的持续演进

昇腾开发板 - OrangePi AIpro介绍:香橙派OrangePi AIpro采用昇腾AI技术路线,具体为4核64位处理器+AI处理器,集成图形处理器,支持8/20 TOPS AI算力,广泛适用于AI边缘计算、深度视觉学习及视频流AI分析等各个行业。满足大多

数AI算法原型验证、推理应用开发的需求。相关资料可以参考下面的截图。

昇思MindSpore+香橙派的特性及支持训练的深度学习模型列表

特性:

  1. 开发友好:动态图易用性提升,类huggingface风格降低开发调试门槛
  2. 性能提升:mindspore.jit编译成图,三行代码实现推理性能提升一倍
  3. 全流程支持:在香橙派上支持模型训推

支持训练和推理模型名称列表:DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-Janus-Pro-1B 、Qwen1.5-0.5b 、TinyLlama-1.1B 、MiniCPM3-4B DctNet ResNet50 、ViT 、FCN 、ShuffleNet 、SSD 、RNN 、LSTM+CRF GAN 、DCGAN 、Pix2Pix 、Diffusion 、ResNet50_transfer

学习心得:

  1. 了解mindspore2.6现有的技术路线及支持的模型训练和推理的支持状况
  2. 对昇腾开发板-香橙派的相关产品有一定了解,以及对围绕香橙派开发板的镜像资源库、开发社区及论坛有一定了解,为后续在开发板上进行模型训练和部署做好准备。
  3. 对香橙派板上支持的mindspore昇腾开发框架和支持模型有进一步了解,为后续开发相关应用做好基础。

http://www.dtcms.com/a/299728.html

相关文章:

  • Chukonu 阅读笔记
  • Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理
  • 如何应对心事干扰学习工作?
  • 高可用集群KEEPALIVED的详细部署
  • 【CTF-Web】dirsearch寻找download.php进行?path=flag.txt任意文件下载
  • 深入解析命名管道:原理、实现与进程间通信应用
  • 机器学习对中特估股票关键特征选取的应用与研究
  • 【橘子分布式】gRPC(番外篇-监听流)
  • Thinkph6中常用的验证方式实例
  • 【时时三省】(C语言基础)用指向函数的指针作函数参数
  • 网络:应用层
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-30,(知识点:传输线特性阻抗,影响因素)
  • 【web应用】基于Vue3和Spring Boot的课程管理前后端数据交互过程
  • 1、虚拟机安装
  • InfluxDB Flux 查询协议实战应用(二)
  • Linux726 raid0,raid1,raid5;raid 创建、保存、停止、删除
  • Python 程序设计讲义(22):循环结构——for 循环
  • 使用FRP搭建内网穿透工具,自己公网服务器独享内外网端口转发
  • C++ APM异步编程模式剖析
  • 2025微前端架构研究与实践方案
  • 【6G新技术探索】AG-UI(Agent User Interaction Protocol) 协议介绍
  • Flutter开发实战之动画与交互设计
  • Java 注解(Annotation)详解:从基础到实战,彻底掌握元数据驱动开发
  • 详细介绍MySQL的索引类型
  • mybatis-plus从入门到入土(三):持久层接口之IService
  • 【MySQL】MySQL 缓存方案
  • 【Redis】Linux 配置Redis
  • 基于华为ENSP的OSPFLSA深入浅出-0
  • 从三维Coulomb势到二维对数势的下降法推导
  • Netty中DefaultChannelPipeline源码解读