当前位置: 首页 > news >正文

启智平台华为昇腾910B使用MS-Swift微调Janus-Pro-7/1B

最近想要微调一下DeepSeek出品的Janus多模态大模型

利用启智平台的昇腾910B国产计算卡进行大模型的微调

查看了一下MS-Swift支持了Janus模型的微调,LLamafactory好像暂时还不支持该模型的微调

看到了MS-Swift有单独对昇腾的支持,因此首先要安装swift,根据下述指令安装即可

pip install ms-swift -U
# 安装torch-npu
pip install torchvision==0.18.1
pip install torch-npu==2.3.1 decorator
pip install pillow -U

然后需要安装昇腾版本的Janus

git clone https://gitee.com/ascend/ModelZoo-PyTorch.git
cd ModelZoo-PyTorch/MindIE/MultiModal/Janus-Pro
pip install -r requirements.txt 
pip install torch-npu
pip install -e .

然后需要下载一个数据集启动模型的LoRA微调训练,我在这下载了Modelscope的LaTeX_OCR数据集,使用其中的human_handwrite进行模型的训练,训练脚本如下保存在 swift_lora.sh中

ASCEND_RT_VISIBLE_DEVICES=0 \
swift sft \
    --model /home/ma-user/work/pretrainmodel/Janus-Pro-7B \
    --train_type lora \
    --dataset /home/ma-user/work/dataset/human_handwrite#50 \
    --torch_dtype bfloat16 \
    --num_train_epochs 
http://www.dtcms.com/a/60133.html

相关文章:

  • Spring(1)——mvc概念,部分常用注解
  • CS6212规格书/USB Type-C Retimer Switch芯片规格详细说明
  • cheby kan网络 与代码学习
  • Android打造易用的 WiFi 工具类:WifiUtils 封装实践
  • 深度学习 PyTorch 中 18 种数据增强策略与实现
  • 40岁开始学Java:如何实现依赖注入?
  • vue+element-plus简洁完美实现古诗文网
  • VSCode配置优化指南:构建高效工程级开发环境
  • Linux操作系统6- 线程1(线程基础,调用接口,线程优缺点)
  • 学习笔记:利用OpenAI实现阅卷智能体
  • AcWing 5438. 密接牛追踪2 区间覆盖问题的详细解释
  • 关闭Windows安全中心,解析与实操指南
  • Git基础之工作原理
  • Spark 3.0核心新特性解析与行业应用展望
  • Docker部署Ragflow(完美解决502 bad gateway)
  • 【RocketMQ 存储】- 异常退出恢复逻辑 recoverAbnormally
  • 机器学习数学基础:44.多元线性回归
  • VTK笔记- 3D Widget类 vtkSplineWidget 样条部件
  • Hadoop项目中的问题(1)——NetworkManager 和 network 服务冲突
  • mysql经典试题共34题
  • fastjson漏洞#不出网#原理#流量特征
  • CD10.【C++ Dev】类和对象(1)
  • 用户仿真任务调度管理平台数据库设计
  • 使用Qt调用HslCommunication(C++调用C#库)
  • 微服务拆分-远程调用
  • 电子学会—2024年12月青少年软件编程(图形化)级等级考试真题——猜年龄互动小游戏
  • Linux之Web控制台管理系统命令终端管理系统(保姆级)
  • 精选一百道题备赛蓝桥杯 —— 1.子串简写
  • 【AI】Deepseek本地部署探索,尝试联网搜索
  • 碰撞率降低57.4%!VLM-AD显著提升自动驾驶规划准确性,无需VLM实时推理