当前位置: 首页 > news >正文

LLaMA-Factory双卡4090微调DeepSeek-R1-Distill-Qwen-14B医学领域

unsloth单卡4090微调DeepSeek-R1-Distill-Qwen-14B医学领域后,跑通一下多卡微调。

1,准备2卡RTX 4090

2,准备数据集

医学领域

pip install -U huggingface_hub
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --resume-download --repo-type dataset FreedomIntelligence/medical-o1-reasoning-SFT --local-dir FreedomIntelligence/medical-o1-reasoning-SFT 


3,安装LLaMA-Factory 和下载模型

需要提前搭建好docker微调环境

下载模型 ,需要是 safetensors 权重文件

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

pip install -e ".[torch,metrics]"

llamafactory-cli webui

# llamafactory-cli version

INFO 04-12 04:48:24 __init__.py:190] Automatically detected platform cuda.

----------------------------------------------------------

| Welcome to LLaMA Factory, version 0.9.3.dev0 |

| |

| Project page: https://github.com/hiyouga/LLaMA-Factory |

----------------------------------------------------------

/workspace# python toShareGPT.py 转换数据集

4,注册数据集

cp /datasets/medical_sharegpt_format.json ./LLaMA-Factory/data/

修改 `data/dataset_info.json`,添加自定义数据集:

"medical_sharegpt_format": {

"file_name": "medical_sharegpt_format.json",

"formatting": "sharegpt",

"columns": {

"messages": "conversations",

"system": "system"

}

}

5,llamafactory-cli webui训练

相关文章:

  • Python itertools模块的groupby函数介绍
  • ctfshow WEB web12
  • 【力扣05】最长回文子串
  • Transformer 分布式训练代码
  • 蓝队技能-Web入侵-入口查杀攻击链
  • 系统设计思维的讨论
  • 常见的后缀名
  • 第九天 开始Unity Shader的学习之单张纹理
  • 指针数组 vs 数组指针
  • MCP结合高德地图完成配置
  • dify windos,linux下载安装部署,提供百度云盘地址
  • SQL:Normalization(范式化)
  • 豪越赋能消防安全管控,解锁一体化内管“安全密码”
  • 07_Z-Stack多节点组网及终端消息上报
  • 《Python星球日记》第26天:Matplotlib 可视化
  • SEER: Self-Aligned Evidence Extraction for Retrieval-AugmentedGeneration
  • SQL 查询中涉及的表及其作用说明
  • docker compose方式安装ClickHouse数据库
  • 工会考试重点内容有哪些:核心考点与备考指南
  • 软考-数据库系统工程师(15万词+400张图片)(一)
  • 做网站要学哪些程序/seo是哪个英文的简写
  • 有哪些免费做网站/搜索引擎优化的定义
  • 做国际网站需要多少钱/关键词排名优化公司地址
  • 苏州网站建设哪家效果好/seo优化软件
  • 东莞外贸网站推广建设/新闻热点最新事件
  • 哈尔滨网站建设信息/关键的近义词