当前位置: 首页 > news >正文

昇思学习营-【模型开发与适配】学习心得_20250724

一、认识香橙派

通过对《昇思+昇腾开发板:软硬结合玩转DeepSeek开发实战》视频课程的学习
了解了以下信息:
1.1 AIpro(20T 24G)香橙派
1.2 了解了香橙派tf卡系统的制卡流程

二、认识大语言模型

通过对课程的学习了解了许多小的大语言模型,如:
• DeepSeek-R1-Distill-Qwen-1.5B
• DeepSeek-Janus-Pro-1B
• Qwen1.5-0.5b
• TinyLlama-1.1B
• MiniCPM3-4B
本次咱们是在香橙派上跑DeepSeek-R1-Distill-Qwen-1.5B大语言模型

三、了解本次课程的软件需求

3.1 需要对香橙派设置一定的swap缓存
3.2 CANN版本要求社区版 8.0.0beta1
3.3 MindSpore版本要求2.5.0
3.4 MindSpore NLP 版本要求0.4分支

四、了解了模型LoRA的微调流程

4.1 在加载模型时,直接加载fp16的权重
4.2 限制拉起的python进程数
4.3 手动限制进程最大内存占用,开了swap然后再限制内存就可以空出来给NPU用

五、了解了模型推理和性能优化的方案

5.1 加载LoRA adapter调优
5.2 在generate_kwargs中添加repetition_penalty=1.2调优
5.3 使用jit优化

http://www.dtcms.com/a/300174.html

相关文章:

  • window上建立git远程仓库
  • Sklearn 机器学习 数值指标 entropy熵函数
  • Linux网络-------1.socket编程基础---(TCP-socket)
  • base64魔改算法 | jsvmp日志分析并还原
  • 在 Dell PowerEdge T440 上通过 iDRAC9 安装 Proxmox VE
  • Flutter开发实战之网络请求与数据处理
  • bmp280的压力数据采集(i2c设备驱动+设备树编写)
  • ACO-OFDM 的**频带利用率**(单位:bit/s/Hz)计算公式
  • 建筑施工场景下漏检率↓76%!陌讯多模态融合算法在工程安全监控的落地实践
  • OpHReda精准预测酶最佳PH
  • 进制间的映射关系
  • 2025牛客暑期多校第4场——G
  • Polyhedral Approaches in Combinatorial Optimization组合优化中的多面体方法(下)
  • Java实现大根堆与小根堆详解
  • 每日面试题15:如何解决堆溢出?
  • 如何检查服务器数据盘是否挂载成功?
  • Android-三种持久化方式详解
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-32,(知识点:模数转换器,信噪比,计算公式,)
  • 深入理解C语言快速排序与自省排序(Introsort)
  • 【每天一个知识点】GAN(生成对抗网络,Generative Adversarial Network)
  • Compose笔记(三十八)--CompositionLocal
  • 安卓学习记录1——持续更新ing
  • React组件中的this指向问题
  • 三防平板支持DMR对讲有什么用?实现高效集群调度
  • 如何理解“测试场景”与“测试要点”的区别和联系?
  • Linux系统架构核心全景详解
  • 从0到1学Pandas(六):Pandas 与数据库交互
  • KiCad 与 CircuitMaker 使用方法分享:从零开始学电子设计
  • JavaWeb(苍穹外卖)--学习笔记11(Filter(过滤器) 和 Interceptor(拦截器))
  • Windows开发,制作开发软件安装程序(一)