当前位置: 首页 > news >正文

启智平台华为昇腾910B使用MS-Swift微调Janus-Pro-7/1B

最近想要微调一下DeepSeek出品的Janus多模态大模型

利用启智平台的昇腾910B国产计算卡进行大模型的微调

查看了一下MS-Swift支持了Janus模型的微调,LLamafactory好像暂时还不支持该模型的微调

看到了MS-Swift有单独对昇腾的支持,因此首先要安装swift,根据下述指令安装即可

pip install ms-swift -U
# 安装torch-npu
pip install torchvision==0.18.1
pip install torch-npu==2.3.1 decorator
pip install pillow -U

然后需要安装昇腾版本的Janus

git clone https://gitee.com/ascend/ModelZoo-PyTorch.git
cd ModelZoo-PyTorch/MindIE/MultiModal/Janus-Pro
pip install -r requirements.txt 
pip install torch-npu
pip install -e .

然后需要下载一个数据集启动模型的LoRA微调训练,我在这下载了Modelscope的LaTeX_OCR数据集,使用其中的human_handwrite进行模型的训练,训练脚本如下保存在 swift_lora.sh中

ASCEND_RT_VISIBLE_DEVICES=0 \
swift sft \
    --model /home/ma-user/work/pretrainmodel/Janus-Pro-7B \
    --train_type lora \
    --dataset /home/ma-user/work/dataset/human_handwrite#50 \
    --torch_dtype bfloat16 \
    --num_train_epochs 

相关文章:

  • Spring(1)——mvc概念,部分常用注解
  • CS6212规格书/USB Type-C Retimer Switch芯片规格详细说明
  • cheby kan网络 与代码学习
  • Android打造易用的 WiFi 工具类:WifiUtils 封装实践
  • 深度学习 PyTorch 中 18 种数据增强策略与实现
  • 40岁开始学Java:如何实现依赖注入?
  • vue+element-plus简洁完美实现古诗文网
  • VSCode配置优化指南:构建高效工程级开发环境
  • Linux操作系统6- 线程1(线程基础,调用接口,线程优缺点)
  • 学习笔记:利用OpenAI实现阅卷智能体
  • AcWing 5438. 密接牛追踪2 区间覆盖问题的详细解释
  • 关闭Windows安全中心,解析与实操指南
  • Git基础之工作原理
  • Spark 3.0核心新特性解析与行业应用展望
  • Docker部署Ragflow(完美解决502 bad gateway)
  • 【RocketMQ 存储】- 异常退出恢复逻辑 recoverAbnormally
  • 机器学习数学基础:44.多元线性回归
  • VTK笔记- 3D Widget类 vtkSplineWidget 样条部件
  • Hadoop项目中的问题(1)——NetworkManager 和 network 服务冲突
  • mysql经典试题共34题
  • “拼好假”的年轻人,今年有哪些旅游新玩法?
  • 构建菌株有效降解有机污染物,上海交大科研成果登上《自然》
  • 优秀“博主”在上海杨浦购房最高补贴200万元,有何条件?
  • 欧洲承诺投资6亿欧元吸引外国科学家
  • “上海之帆”巡展在日本大阪开幕,松江区组织企业集体出展
  • 央行:全力推进一揽子金融政策加快落地