当前位置: 首页 > news >正文

借助LLama_Factory工具对大模型进行lora微调

文章目录

    • 参考资料
  • 微调方法
  • LORA微调方法
  • LLama_factory基本介绍
  • autodl LLaMA-Factory私有化部署
  • LLaMA Board微调Qwen2.5 1.5B模型
  • 安装TensorBoard监控

参考资料

  • 【1】LoRA:大模型轻量级微调 - 今日头条
  • 【2】大模型微调论文阅读 LoRA:LOW-RANK ADAPTION OF LARGE LANGUAGE MODELS - CSDN
  • 【3】LoRA论文回顾 - 知乎
  • 【4】论文阅读:LoRA: Low-Rank - 今日头条
  • 【5】大模型中的微调LoRA是什么 - CSDN

微调方法

微调,从参数规模来看,大体上可以分为全参数微调和高效参数微调

  • 全参数微调通常以预训练模型的初始权重为基础,在特定数据集上继续训练,更新模型的所有参数。

  • 高效参数微调旨在使用更少的资源来更新模型参数,这包括仅更新部分参数或通过对参数施加某些结构化约束来实现。后者就涵盖了我们在之前课程中提到的高效微调技术,如PEFT、LoRA和QLoRA等方法。

  • 指令微调,是一种通过在由(指令,输出)对组成的数据集上进一步训练LLMs的过程。其中,指令代表模型的人类指令,输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。它可以被视为有监督微调(Supervised Fine-Tuning,SFT)的一种特殊形式。但是,它们的目标依然有差别。

  • SFT是一种使用标记数据对预训练模型进行微调的过程,以便模型能够更好地执行特定任务。而指令微调是一种通过在包括(指令,输出)对的数据集上进一步训练大语言模型(LLMs)的过程,以增强LLMs的能力和可控性。

  • 指令微调的特殊之处在于其数据集的结构,即由人类指令和期望的输出组成的配对。这种结构使得指令微调专注于让模型理解和遵循人类指令。

  • 总的来说,指令微调是有监督微调的一种特殊形式,专注于通过理解和遵循人类指令来增强大语言模型的能力和可控性。其形式如下:

{"instruction": "彩霞山的地理特征及其在七玄门防御体系中的作用是什么","input": "","output": "彩霞山原名落凤山,是镜州境内第二大山,占地广阔,方圆十几里,拥有十几个大小不一的山峰,地势十分险要。其中主峰名为“落日峰”,不仅奇高陡峭,而且从山底到峰顶仅有唯一一条通路。七玄门将总堂设于落日峰上,并在这条唯一通路上的关键险要位置,设置了十三处或明或暗的哨卡,构成了严密的防御体系。凭借这种天然的地形优势和人工布防,七玄门实现了易守难攻的格局,使其总门所在地可谓万无一失、高枕无忧。此外,彩霞山自被七玄门占据后,便禁止外人随意进入,进一步强化了其作为宗门核心据点的战略价值和安全性。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"}
  • instruction:任务指令,不能为空。
  • input:任务输入,可为空。如果不为空,项目内部处理训练数据时,会将 instruction、input 拼接在一起作为任务的输入。
  • output:任务输出,不能为空。

LORA微调方法

  • LoRA 低秩矩阵微调 paper、 Github地址 。
  • LoRA(Low-Rank Adaptation,低秩适应)是一种用于高效微调大型预训练模型(如大语言模型)的技术。其核心目标是:在不改变基准模型(即预训练模型)主体参数的前提下,通过引入少量可训练的参数,使模型高效地适应特定任务或领域,同时显著降低计算和存储开销

LoRA的核心思想可以概括为:

  • 基准模型不变:预训练模型的主体参数(权重矩阵)保持冻结,不参与训练。
  • 引入低秩矩阵:在模型的某些层(如Transformer的注意力层)旁,额外增加两个小型矩阵(通常称为A和B),它们的乘积可以近似一个低秩的“增量矩阵”,用于捕捉任务相关的变化。
  • 只训练新增参数:在微调过程中,仅训练这两个低秩矩阵(A和B),而不改变原始模型的参数。
  • 推理时合并:训练完成后,可以将A和B的乘积与原始权重合并,推理时与原始模型结构完全一致,不引入额外计算开销。

设原始模型的权重矩阵为 W 0 W_0 W0,微调时引入两个低秩矩阵 A A A B B B(秩 r ≪ min ⁡ ( d , k ) r \ll \min(d, k) rmin(d,k)),则:
W = W 0 + Δ W = W 0 + B A W = W_0 + \Delta W = W_0 + B A W=W0+ΔW=W0+BA
其中:

  • W 0 W_0 W0 是预训练模型的原始权重矩阵(固定不变),
  • Δ W = B A \Delta W = BA ΔW=BA 是通过低秩矩阵近似得到的增量,
  • A A A B B B 是需要训练的小型矩阵,参数量远小于 W 0 W_0 W0

在这里插入图片描述


适用场景

  • 资源受限环境(如个人GPU)微调大模型。
  • 需要为多个下游任务快速定制模型。
  • 希望保留原模型通用能力,防止灾难性遗忘。
  • 需要频繁更新模型但不想每次传输完整模型参数。

简要流程

  1. 冻结原始模型:保持预训练模型参数不变。
  2. 注入低秩矩阵:在选定层(如注意力层)旁添加低秩矩阵A和B。
  3. 微调训练:仅训练A和B,其他参数冻结。
  4. 合并与部署:训练完成后,将 B A BA BA W 0 W_0 W0 合并,直接用于推理。

LoRA的主要优势

  1. 参数高效:只需训练极少量参数(如原模型的千分之一甚至更少),极大降低训练和存储成本。
  2. 模块化:不同任务可以各自训练一组独立的低秩矩阵,方便切换和扩展。
  3. 性能保持:实验表明,LoRA在多种任务上的表现接近甚至媲美全参数微调。
  4. 推理无额外开销:训练后可将低秩矩阵与原始权重合并,推理结构与原模型一致,无额外延迟。

本征维度(Intrinsic Dimension):是指数据或空间中所需的最小维度,以便充分描述其中的结构或特征。换句话说,尽管数据可能存在于高维空间中,但其实际所包含的信息可能集中在一个更低维度的子空间内,本征维度就是描述这个低维子空间的维度。

LLama_factory基本介绍

  • LLaMA-Factory是GitHub上开源的项目,提供易于使用的大语言模型(LLM)微调框架,支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。项目提供从预训练、指令微调到RLHF阶段的开源微调解决方案。其中LLaMA Board,这是一个零代码、可视化的一站式网页微调界面,它允许通过Web UI轻松设置各种微调过程中的超参数,且整个训练过程的实时进度都会在Web UI中进行同步更新。
  • 通过该项目,只需下载相应的模型,并根据项目要求准备符合标准的微调数据集,即可快速开始微调过程,有效地将特定领域的知识注入到通用模型中,增强模型对特定知识领域的理解和认知能力,以达到“通用模型到垂直模型的快速转变”。

  • 大模型训练与微调生态系统概览表
类别项目/技术核心功能与特点最新进展与备注 (含图像支持)
基础模型LLaMA / LLaMA 2 / LLaMA 3Meta 开源的基础语言模型系列,性能强大,是许多研究和应用的基础。LLaMA 3 在性能和安全性上均有显著提升,社区生态极其丰富。
LLaVA多模态模型,将 LLaMA 与视觉编码器结合,实现图文理解和对话。支持图像输入。是开源多模态模型的标杆之一,衍生出众多变体(如 LLaVA-1.5, LLaVA-NeXT)。
Mistral / Mixtral-MoEMistral AI 发布的高性能模型。Mixtral 采用了 稀疏混合专家 架构,在保持高质量的同时大幅提升推理效率。Mixtral-MoE 是开源模型中性能的佼佼者,尤其擅长代码和推理任务。
Qwen / Qwen2-VL阿里巴巴通义千问系列。Qwen2-VL 是其最新的 视觉语言模型,支持高分辨率图像理解和多图对话。Qwen2-VL 支持图像输入,并在多个多模态基准测试中表现优异,是当前最先进的开源 VLM 之一。
Yi / Yi-VL01.AI 发布的模型系列。Yi-VL 是其对应的多模态版本。Yi-VL 支持图像输入,同样具备强大的视觉理解和对话能力。
GemmaGoogle 基于其 Gemini 技术开源的轻量级模型家族,强调负责任的 AI 和易用性。提供多种尺寸(2B, 7B),适合在资源受限的环境下部署和研究。
Baichuan (百川)百川智能发布的中英双语大模型,在中文领域表现突出。Baichuan2 系列在开源社区广受欢迎,拥有强大的中文理解能力。
ChatGLM智谱 AI 与清华共同开发的中英双语对话模型,优化了中文对话体验。ChatGLM3/ChatGLM4 引入了工具调用、代码解释器等 Agent 能力。
PhiMicrosoft 发布的“小语言模型”,通过高质量“教科书级”数据训练,在极小参数量下实现惊人性能。Phi-3 系列在推理、代码和数学能力上远超同规模模型。
集成方法(增量)预训练在海量无标注或弱标注数据上继续训练模型,以注入新知识或适应新领域。是构建领域专用模型(如法律、医疗)的基础步骤。
(多模态)指令监督微调 (SFT)使用高质量的“指令-回答”数据对(可包含图文)进行微调,让模型学会遵循指令和进行对话。多模态 SFT 是训练 VLM 的核心环节,需要构建包含图像的指令数据集。
奖励模型训练训练一个模型来对多个模型输出进行排序打分,为强化学习提供奖励信号。是 RLHF 流程中的关键一步,质量直接影响最终模型的对齐效果。
PPO / DPO / KTO / ORPO人类偏好对齐算法
PPO: 基于强化学习,使用奖励模型指导策略优化。
DPO: 直接优化偏好数据,无需训练独立的奖励模型,更稳定高效。
KTO: 只需知道一个输出是“好”还是“坏”,数据标注成本更低。
ORPO: 将偏好对齐与 SFT 合并为一个步骤,简化流程。
DPO 及其变体 (如 ORPO, SimPO) 已成为主流,因其实现简单、效果稳定而广受青睐,逐渐取代复杂的 PPO。
训练精度全参数微调 (16-bit)更新模型所有参数,效果通常最好,但计算和存储成本极高。适用于资源充足、追求极致性能的场景。
LoRA / QLoRA参数高效微调
LoRA: 冻结原模型,只训练低秩分解的增量矩阵。
QLoRA: 结合 4-bit 量化(如 NF4)和 LoRA,在消费级 GPU 上微调大模型。
QLoRA 是目前个人开发者和研究者微调大模型最主流的方法,极大降低了门槛。
量化微调 (AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ)将模型权重量化为低比特(如 2/3/4/5/6/8-bit)以减少内存占用,常与 QLoRA 配合使用。AWQGPTQ 是应用最广的量化方法。AQLM 在极低比特(如 2-bit)下表现优异,是前沿研究方向。
先进算法GaLore / BAdam / Adam-mini内存优化优化器
GaLore: 通过低秩分解降低优化器状态内存。
BAdam: 块状自适应优化,减少内存占用。
Adam-mini: 通过近似计算大幅减少 Adam 的内存和计算开销。
这些算法旨在用更少的内存训练更大的模型或使用更大的批次,是全参数微调的关键技术。
DoRA / LoRA+ / LoftQ / PiSSALoRA 改进算法
DoRA: 在 LoRA 基础上增加方向和幅度的解耦,性能更优。
LoRA+: 调整 LoRA 的学习率策略,收敛更快。
LoftQ: 在量化后初始化 LoRA 权重,缓解量化带来的性能损失。
PiSSA: 对权重增量进行奇异值分解初始化,性能优于标准 LoRA。
DoRA 和 PiSSA 在多项任务中显示出比标准 LoRA 更好的性能,是 PEFT 领域的重要进展。
LongLoRA / LLaMA Pro / Mixture-of-Depths模型架构扩展算法
LongLoRA: 高效扩展模型上下文长度。
LLaMA Pro: 通过扩展而非替换来增加模型容量。
Mixture-of-Depths: 动态选择每层计算的 token,提升效率。
这些方法用于在基础模型之上进行高效的能力扩展,如处理长文本或提升特定能力。
实验监控LlamaBoard / TensorBoard / Wandb / MLflow训练过程可视化与管理工具
TensorBoard: TensorFlow 生态标配,功能全面。
Wandb: 云端协作平台,追踪实验、记录日志、可视化图表,社区流行度高。
MLflow: 开源的 MLOps 平台,管理整个机器学习生命周期。
LlamaBoard: 专为 Llama 系列模型设计的监控工具。
Wandb 因其强大的云端协作和美观的界面,成为许多 AI 实验室的首选。
极速推理vLLM / OpenAI 兼容 API高性能推理引擎
vLLM: 通过 PagedAttention 技术极大提升服务吞吐量,是部署 LLM 服务的事实标准。
OpenAI 兼容 API: 将模型封装成与 OpenAI API 格式一致的服务,方便现有应用无缝切换。
vLLM + OpenAI API 是目前部署开源大模型服务的黄金组合,提供了浏览器界面、CLI 和 API 等多种交互方式。
社区资源Hugging Face / GitHub / ModelScope开源模型与代码托管平台
Hugging Face: 全球最大的 AI 社区,提供模型、数据集、库和 Spaces。
GitHub: 代码托管和协作平台。
ModelScope: 阿里巴巴达摩院推出的模型即服务平台,中文资源丰富。
这些平台是获取预训练模型、微调脚本、数据集和交流学习的核心枢纽,构成了繁荣的开源生态。
  • 在使用该项目进行微调的时候,需要关注如下三点内容:支持的大模型、支持的训练方法和对应的训练数据格式。

  • 虽然LLaMA-Factory项目运行特定参数量的模型是否可行,仍然取决于本地硬件资源是否充足。不同模型参数在不同训练方法下的显存占用情况
    在这里插入图片描述

autodl LLaMA-Factory私有化部署

  • LLaMA-Factory的私有化部署过程,主要包括创建Python虚拟环境、下载项目文件及安装所需的依赖包。LLaMA-Factory私有化部署对本地软硬件环境。

    • Pytorch:2.8.0+cu128
    • cuda:12.8
    • python:3.11.4
  • 在autodl平台,租用一张3090即可,进行本文章中实践,注意选择Pytorch:2.8.0+cu128、cuda:12.8、python:3.11.4。

  1. 使用Conda创建LLaMA-Factory的Python虚拟环境
     conda create  --name llama_factory python==3.11
    
  2. 进入该虚拟环境,执行后续的操作
    conda activate llama_factory
    
  3. 根据CUDA版本要求安装Pytorch:https://pytorch.org/get-started/previous-versions/。根据自己电脑显卡驱动的CUDA版本要求,在Pytorch官网中找到适合自己的Pytorch安装命令。
    conda install pytorch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 pytorch-cuda=12.1 -c pytorch -c nvidia
  1. 验证安装GPU 版Pytorch是否成功
    python -c "import torch; print(torch.cuda.is_available())"
  1. 下载LLaMA-Factory的项目文件:LLaMA-Factory的官方Github, 在 GitHub 上将项目文件下载到本地。安装git软件包,执行克隆命令,将LLaMA-Factory Github上的项目文件下载至本地的当前路径下

    sudo apt install git
    
    git clone https://github.com/hiyouga/LLaMA-Factory.git
    
  2. 重命名LLaMA-Factory-main为LLaMA-Factory:mv LLaMA-Factory-main LLaMA-Factory

  3. 升级pip版本:升级 pip 很简单,只需要运行命令如下命令。

    python -m pip install --upgrade pip
    
  4. 使用pip安装LLaMA-Factory项目代码运行的项目依赖

    # 进入文件夹
    cd LLaMA-Factory
    # 找到requirements.txt安装文件
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
    pip install -e ".[torch,metrics]" --no-build-isolation -i https://pypi.tuna.tsinghua.edu.cn/simple/ # 安装LLaMA-Factory本身,然后在系统中生成一个命令 llamafactory-cli
    
  5. 校验

    llamafactory-cli train -h 
    

LLaMA Board微调Qwen2.5 1.5B模型

  1. 下载模型
modelscope download --model Qwen/Qwen2.5-1.5B-Instruct --local_dir /root/autodl-fs
  1. 启动对话窗口验证模型是否完整
  GRADIO_SERVER_PORT=6006 llamafactory-cli webchat --model_name_or_path /root/autodl-fs/Qwen2.5-1.5B-Instruct --template qwen
  1. 启动LlamaBoard
GRADIO_SERVER_PORT=6006 llamafactory-cli webui --model_name_or_path /root/autodl-fs/Qwen2.5-1.5B-Instruct --template qwen

llama_factory常用命令

动作参数枚举参数说明
version显示版本信息
train命令行版本训练
chat命令行版本推理chat
export模型合并和导出
api启动API server,供接口调用
eval使用mmlu等标准数据集做评测
webchat前端版本纯推理的chat页面
webui启动LlamaBoard前端页面,包含可视化训练,预测,chat,模型合并多个子页面
  1. 适用autodl-ssh-tools将6006挂载到本地
    http://localhost:6006/
    
  2. 准备数据集:将微调数据上传到llm_factory的data目录下,然后再info文件中添加数据集名称和文件信息。
[{"instruction": "韩立在竹林路段遇到了哪些困难","input": "","output": "韩立在竹林路段遇到了多重困难。首先,竹林范围非常宽广,三十余名孩童一进入就分散开来,导致他必须独自面对漫长的攀爬过程。其次,随着行进时间延长,他感到腿部越来越沉重,体力迅速消耗,不得不借助一只手拉住竹子的茎秆来减轻负担、节省力气。行至中途,他已疲惫不堪,只能坐在土堆上大口喘息,体力明显不支。此外,他身后紧跟着一位瘦长、冷面、一言不发的师兄,对方始终静静站立、纹丝不动,目光冰冷,令韩立心生畏惧,不敢多作停留,只能强撑继续前行。随着坡度逐渐变陡,他最终不得不弯下腰,手脚并用爬行,全靠衣服结实才避免关节和膝盖被磨破。临近竹林出口时,地面岩石增多、竹子减少,他再也无法借助竹竿借力,只能一米一米艰难挪动,体力濒临极限。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "选拔开始前,岳堂主如何安抚孩童们的情绪","input": "","output": "选拔开始前,岳堂主通过向孩童们说明安全措施来安抚他们的情绪。他大声告诉大家不要害怕,并明确表示会有师兄们在后面护住他们,确保他们不会遇到危险。这一话语旨在减轻孩子们面对未知挑战时的恐惧和紧张,让他们能够安心参与选拔。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "彩霞山的地理特征及其在七玄门防御体系中的作用是什么","input": "","output": "彩霞山原名落凤山,是镜州境内第二大山,占地广阔,方圆十几里,拥有十几个大小不一的山峰,地势十分险要。其中主峰名为“落日峰”,不仅奇高陡峭,而且从山底到峰顶仅有唯一一条通路。七玄门将总堂设于落日峰上,并在这条唯一通路上的关键险要位置,设置了十三处或明或暗的哨卡,构成了严密的防御体系。凭借这种天然的地形优势和人工布防,七玄门实现了易守难攻的格局,使其总门所在地可谓万无一失、高枕无忧。此外,彩霞山自被七玄门占据后,便禁止外人随意进入,进一步强化了其作为宗门核心据点的战略价值和安全性。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "攀爬沉积岩壁时,韩立的身体受到了哪些伤害","input": "","output": "在攀爬沉积岩壁时,韩立的身体受到了多处伤害:双手伤痕累累,手肘和膝盖处的衣服被划破,里面的皮肉也被割伤多处。虽然每处伤口都不大,但有细小的碎石渣渗入伤口中,加剧了疼痛感。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "成为七玄门正式弟子和记名弟子的条件分别是什么","input": "","output": "成为七玄门正式弟子的条件是:在正午之前成功通过炼骨崖的全部三段路程(竹林地段、岩壁地带、山崖),并最终抵达崖顶。\n\n成为记名弟子的条件是:未能在正午前到达崖顶,但在此过程中表现有可圈可点之处。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "参加七玄门入门考查的孩童被分为哪三类?各自的特点是什么","input": "","output": "参加七玄门入门考查的孩童被分为以下三类:\n\n第一类是以舞岩为代表的锦衣少年。他们家境富裕且有势力,例如舞岩家中开设武馆,本人还自小练习拳脚功夫,虽武艺不高,但足以胜过从未习武的普通孩童。这类人因出身优越、略有武艺,自然成为其他孩童中的“大哥”,受到簇拥。\n\n第二类是围绕在舞岩周围的大多数孩童。他们出身各异,有的来自开店家庭,有的父母是工匠或打工者,但共同点是都在城镇中长大,从小耳濡目染,学会察言观色、趋利附势,因此主动讨好舞岩,频繁称呼其为“舞少爷”或“舞大哥”,以求融入核心圈子。\n\n第三类是像韩立这样来自偏远穷乡僻壤的孩童。他们家庭极为贫苦,靠山吃山、靠水吃水,缺乏见识,性格普遍畏缩拘谨,不敢大声说话,在车厢中人数最少,仅有五六人,与前两类喧闹活跃的孩童形成鲜明对比。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "炼骨崖选拔的路线分为哪几个阶段","input": "","output": "炼骨崖选拔的路线分为三个阶段:第一段是竹林地段,第二段是岩壁地带,第三段是一个山崖。参与者需要从竹林中的小路出发,依次经过这三个区域,最终到达崖顶。只有在正午前成功抵达崖顶的人,才能成为七玄门的正式弟子;若未能按时到达,但表现有可圈可点之处,仍有机会被收为记名弟子。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "岳堂主对未通过选拔的孩童有何安排","input": "","output": "岳堂主规定,若孩童在正午前未能到达炼骨崖崖顶,则不能成为七玄门的正式弟子。但对于这些未通过者,如果在选拔过程中表现有可圈可点之处,仍可被收为记名弟子。此外,在选拔前一晚,所有孩童被安排在清客院休息,岳堂主还特别交代,未过关者应及早下山,以免触犯山上的规矩。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立等人被安置在何处过夜?","input": "","output": "韩立等人被安置在一座较矮的山峰的山顶上的一片土房中过夜。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "彩霞山原名是什么?为何后来改名为彩霞山","input": "","output": "彩霞山原名是落凤山。相传古时有一头五色彩凤落在此地,化成了此山,因此得名落凤山。后来因为人们发现此山在落日时分景色异常美丽,整座山仿佛被彩霞笼罩,于是又改称为彩霞山。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "舞岩为何能成为车厢内孩童中的核心人物","input": "","output": "舞岩之所以能成为车厢内孩童中的核心人物,主要有三个原因:首先,他家境富裕,家中开设武馆,经济条件优越;其次,他有门派内部关系背景,其表姐嫁给了七玄门内的一名掌权人物,这使他即使年龄超过规定也能被特许参加入门考查,显示出其家族在门派中具有一定影响力;第三,他自小习练拳脚功夫,虽不算高明,但相比韩立等从未习武、仅有蛮力的乡下孩童,仍具备明显优势。此外,车厢内大多数孩童来自城镇,懂得察言观色、趋利附势,自然主动簇拥舞岩,尊称他为“舞少爷”或“舞大哥”,而舞岩对此早已习惯且颇为受用,进一步巩固了他在群体中的核心地位。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "王护法见到岳堂主后态度发生了怎样的变化?","input": "","output": "王护法见到岳堂主后,态度发生了明显转变。在路上时他一贯表现得跋扈傲慢,但一见到岳堂主,立即变得恭敬谦卑,主动上前施礼,并面带媚色,言语中也充满敬意和客气,称“路上耽搁了些时间,烦您老费心了”,完全收敛了此前的嚣张气焰。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "野狼帮的起源及其与七玄门的冲突原因是什么","input": "","output": "野狼帮起源于镜州境内一股烧杀掳掠的马贼。这股马贼后来遭到官府多次围剿,其中一部分接受了招安,另一部分则演变为野狼帮。尽管身份转变,但野狼帮继承了马贼凶狠嗜血、敢杀敢拼的狠劲。\n\n野狼帮与七玄门的冲突主要源于地盘和资源的争夺。七玄门虽已衰落,但仍控制着包括青牛镇在内的十几个较富裕的城镇,而野狼帮虽然控制的乡镇数量更多,却缺乏经营能力,整体富足程度远不及七玄门。因此,野狼帮对七玄门旗下较富裕的地盘十分眼馋,近年来频繁挑起冲突。在双方对抗中,七玄门因野狼帮的凶悍作风而屡屡处于下风,这也促使七玄门不断扩招弟子以增强自身实力。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "王护法亲自前来接引新弟子的原因是什么?","input": "","output": "王护法亲自前来接引新弟子,是因为近期路上不太平,需要加强防卫,七玄门长老因此命令他亲自前来领人,以确保途中安全。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "七玄门近年来大量扩招弟子的主要原因是什么","input": "","output": "七玄门近年来大量扩招弟子的主要原因是野狼帮频繁挑起冲突,企图夺取七玄门旗下较为富裕的城镇地盘。野狼帮虽控制的乡镇数量较多,但不善经营,经济远不如七玄门富足,因此对七玄门的富裕地盘十分眼馋,不断主动挑衅。由于野狼帮继承了马贼凶狠嗜血、敢杀敢拼的作风,七玄门在与其冲突中屡屡处于下风,现任门主对此头疼不已,为增强自身实力以应对持续的外部威胁,不得不一再扩大弟子招募规模。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "七玄门为何从镜州城搬迁至仙霞山?","input": "","output": "七玄门原为越国镜州一带的强势门派,由二百年前的“七绝上人”创立,曾雄霸镜州数十载,并一度将势力扩展至邻近数州。然而,在“七绝上人”病故后,门派势力迅速衰落,遭到其他门派联手排挤,最终被逐出镜州首府镜州城。百年前,七玄门被迫迁往镜州最偏僻的仙霞山,并在此重新扎根,逐渐沦为三流地方小势力。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "舞岩因何被直接保送至七绝堂学习本门绝技?","input": "","output": "舞岩被直接保送至七绝堂学习本门绝技,是因为他在入门测试中第一个到达山崖顶部,表现杰出。在测试过程中,他不仅身体强壮、练过武功,而且率先攀完陡峭的三十余丈垂直山崖,并成功通过悬吊的麻绳登顶,远超其他孩童的表现,因此获得岳堂主的特别认可,并由身穿深蓝员外袍的五十余岁富态老者(墨大夫)点头同意,直接保送进入七绝堂。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "岳堂主宣布合格者名单时,提到韩立和张铁具备什么共同特质","input": "","output": "岳堂主宣布合格者名单时指出,韩立和张铁虽然未能在规定时间内到达崖顶,但两人表现出的共同特质是“表现突出,看来能吃习武之苦”。这一特质使他们获得了留在门中、跟随教习打下根基的机会,并约定半年后再次考核,合格则成为内门弟子,不合格则转为外门弟子。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "测试结束后,未通过考核的孩童是如何被处理的","input": "","output": "测试结束后,未通过考核的孩童由王护法负责处理。岳堂主下令,让王护法给这些未过关的孩童每人发放一些银子,随后将他们全部遣送回家。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "在攀爬麻绳前,韩立看到身后的师兄做出了什么防护动作","input": "","output": "在攀爬麻绳前,韩立因体力不支险些从石壁上滑落,此时他身后的师兄半蹲着身子,将两只手臂敞开,摆出了防护他的姿势,以防他坠落。直到确认韩立重新抓牢石角、恢复安全后,这位师兄才缓缓站直身子。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立和张铁两人未按时到达崖顶,却获得了怎样的特殊安排","input": "","output": "韩立和张铁两人虽然未能在规定时间内到达崖顶,但因表现突出,被认为能吃习武之苦,因此获得了特殊安排:他们被允许先留在七玄门,跟随几名教习打下武学根基,半年后再进行一次考核;若考核合格,则正式成为内门弟子,若未合格,则被送往外门担任外门弟子。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "本次入门测试中,共有多少名孩童被判定为合格?","input": "","output": "本次入门测试中共有9名孩童被判定为合格。其中,6名小童直接进入百锻堂,成为内门弟子;舞岩因第一个到达崖顶、表现杰出,被直接保送至七绝堂学习本门绝技;此外,张铁和韩立虽未按时到达崖顶,但因表现突出,被给予半年时间打基础后再行考核,也被视为暂时合格,纳入门中培养。因此,合格孩童总数为6 + 1 + 2 = 9人。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立在攀爬过程中为何感到灰心并一度想要放弃?","input": "","output": "韩立在攀爬过程中感到灰心并一度想要放弃,主要是因为他意识到自己无论如何努力都无法追上最前面的几人,尤其是看到舞岩已经率先攀上巨石壁尽头并开始沿着麻绳向崖顶移动,而自己却因体力耗尽、身体沉重,连与前方的距离都无法拉近。此时太阳已接近正午,时间所剩无几,他清楚自己不可能在规定时间内到达崖顶。这一念头刚起,手肘和膝盖的伤处便传来剧烈疼痛,四肢顿时无力,甚至一度失手滑落,虽被身后的师兄及时防护才未坠下,但身心俱疲的状态让他产生了放弃的念头。尽管如此,他仍因不甘心和不愿显得难看而试图继续攀爬,但双手已完全不听使唤,根本无法抓紧绳子,最终只能坐在绳结上动弹不得,内心充满无奈与自我苦笑。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立最终是如何到达山崖顶部的","input": "","output": "韩立在攀爬山崖的过程中因体力耗尽,双手僵硬,完全无法继续抓住麻绳向上攀登,最终坐在绳结上动弹不得。就在他无力继续前进时,一直跟在他身后的那位师兄出手相助,一手抱住韩立,另一只手和双腿敏捷地向上攀爬,将他带到了山崖顶部。因此,韩立是依靠这位师兄的帮助才成功到达崖顶的。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "舞岩在到达崖顶后对崖下的孩童做了什么举动","input": "","output": "舞岩在到达崖顶后,回头往下望,恰好看到韩立爬到麻绳底部。他随即举起手臂,伸出小拇指对着崖下的孩童轻轻比了两下,接着哈哈一阵狂笑,然后便离开了。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立内心深处的梦想是什么?他为何不敢向他人透露这个想法?","input": "","output": "韩立内心深处的梦想是走出自己生活的巴掌大的小村庄,去亲眼看看外面世界的富饶与繁华。这个想法源于他从小听村里唯一识字的老张叔讲述外面的世界,从而在心中埋下了向往的种子。尽管年纪只有十岁,他的内心却比同龄人早熟许多,渴望摆脱困顿的乡村生活,见识更广阔的天地。\n\n他不敢向他人透露这个想法,是因为在当时的村子里,这种念头被视为极其不合常理。其他和他差不多大的孩子还只会满村追鸡摸狗,连基本的温饱都尚且依赖家庭,根本不会想到离开故土。如果韩立将自己想走出村子的愿望说出来,一定会让村里人感到愕然,甚至可能被当作不切实际、异想天开的小孩。因此,他一直将这个梦想深藏心底,从未敢与人分享。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立的三叔从事什么职业?他在家族中扮演了怎样的角色?","input": "","output": "韩立的三叔在附近一个小城的酒楼担任大掌柜。这家酒楼隶属于一个名为“七玄门”的江湖门派。三叔不仅是酒楼的重要管理者,还因工作关系正式成为了七玄门的外门弟子,具备推举七岁到十二岁孩童参加该门派内门弟子选拔测试的资格。\n\n在家族中,三叔是一位有身份、有能力的至亲,被韩立父母视为“大能人”。他是韩家近百年来少有的体面人物,不仅曾为韩立的大哥介绍铁匠学徒的工作,还经常托人捎带食物和日用品接济韩立一家,对家族多有照顾。此次他专程前来,是为了推荐年仅十岁的韩立参加七玄门五年一度的内门弟子选拔,意图为其提供改变命运的机会,体现出他在家族中扮演着提携后辈、助力家人向上发展的关键角色。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩父对三叔提出的让韩立参加七玄门测试的建议持什么态度?原因是什么","input": "","output": "韩父对三叔提出的让韩立参加七玄门测试的建议持犹豫不决的态度。原因是他一向老实巴交,从未听说过“江湖”“门派”这类事情,对这些陌生的概念感到陌生和不安,因此拿不定主意。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "三叔在带韩立抵达青牛镇后,对他提出了哪些叮嘱和安排?","input": "","output": "三叔在带韩立抵达青牛镇后,对他做了以下叮嘱和安排:\n\n首先,三叔将韩立带到春香酒楼后面一个偏僻的小院子里,并指着院里的厢房,让他在屋里好好休息,养好精神,以便等内门的管事一来就过去参加考验。\n\n其次,三叔嘱咐韩立不要乱跑,理由是镇子里人太多,容易走丢,并明确建议他最好别出院子。\n\n此外,在当天晚上三叔回来后,还关心地询问韩立饭菜是否合胃口、是否想家,并通过聊家常和讲自己经历过的趣人趣事,帮助韩立放松情绪、消除拘束感。\n\n这些安排和叮嘱体现了三叔对韩立安全和状态的重视,旨在确保他能以最佳身心状态迎接即将到来的七玄门考验。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立在进山拣柴时心里惦记着为谁做些什么?具体是什么","input": "","output": "韩立在进山拣柴时心里惦记着为他最疼爱的妹妹多拣些她最喜欢吃的红浆果。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "七玄门招收内门弟子的年龄范围和测试频率分别是多少?","input": "","output": "七玄门招收内门弟子的年龄范围是七岁到十二岁,测试每五年举行一次。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩胖子与韩立的真实关系是什么?镇上其他人对此有何误解","input": "","output": "韩胖子是韩立的三叔,两人是叔侄关系。韩胖子是韩立父亲的本家兄弟,他受托带韩立前往青牛镇,准备参加七玄门的入门考验,并安排他在自己经营的春香酒楼暂住。镇上有人并不知道他们的真实关系,看到韩立皮肤黝黑、长相与韩胖子有几分相似,便误以为韩立是韩胖子背着家中妻子偷偷生下的私生子,并当众打趣调侃。韩胖子对此并未生气,反而有些得意,并明确澄清韩立是自己“本家带来的亲侄子”,从而纠正了众人的误解。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立为什么被村里人称为“二愣子”","input": "","output": "韩立被村里人称为“二愣子”,是因为村里已经有一个叫“愣子”的孩子了,为了区分,便在他名字前加了个“二”字,形成了“二愣子”这个绰号。这种起绰号的方式在村里很常见,其他孩子也多被叫作“狗娃”“二蛋”之类的名字。尽管韩立并不喜欢这个称呼,但他也只能接受并自我安慰,毕竟这些名字都不见得比“二愣子”好听多少。实际上,韩立并不傻,反而是村中首屈一指的聪明孩子,只是这个外号与他的真实性格并无关联,纯粹是出于村里习惯性的称呼方式。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立的名字是谁起的?起名时付出了什么代价","input": "","output": "韩立的名字是由村里唯一识字的读书人老张叔起的。他的父亲为了给儿子求一个像模像样的名字,用两个粗粮制成的窝头作为酬谢,请老张叔帮忙取名。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立的家庭成员构成是怎样的?他在家中排行第几","input": "","output": "韩立家中共有七口人,包括父母、两个兄长、一个姐姐、一个妹妹,以及他自己。他在家中排行第四,今年十岁。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "那辆插有‘玄’字黑旗的马车为何能被江湖人士识别为七玄门重要人物所乘?","input": "","output": "那辆插有“玄”字黑旗的马车之所以能被江湖人士识别为七玄门重要人物所乘,是因为马车边框上插着一面绣有“玄”字的小三角黑旗,旗面为银字红边,具有鲜明且独特的标识特征。在方圆数百里范围内活动的江湖老手都熟知,这面旗帜是七玄门的象征,而七玄门正是当地两大霸主之一。因此,一旦见到这面“玄”字黑旗,经验丰富的江湖人士便能立即认出这是七玄门的重要人物驾临。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩父为何最终同意让韩立跟随三叔离开?","input": "","output": "韩父最终同意让韩立跟随三叔离开,是因为三叔详细说明了加入“七玄门”的诸多好处:只要成为内门弟子,不仅能免费习武、吃喝不愁,每月还能领取一两多的散银作为零花;即使未能通过考验,也有机会成为像三叔一样的外门人员,专门替“七玄门”打理门外生意,过上体面的生活。当韩父听说韩立有可能每月获得一两银子,并有机会成为和三叔一样受人尊敬的体面人时,终于下定决心答应了此事。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "青牛客栈在镇中的位置及其对过往商客的意义是什么","input": "","output": "青牛客栈位于青牛镇西端,是这个长条形状小镇中唯一的一家客栈。由于镇子规模很小,主街道仅有东西走向的青牛街,因此过往商客若不想露宿野外,就只能选择入住青牛客栈。这使得青牛客栈成为途经此地的商旅人员唯一可依赖的住宿场所,具有不可替代的实用意义。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "韩立在离家时内心产生了怎样的情感和决心","input": "","output": "韩立在离家时内心充满了伤感与彷徨。尽管他从小比同龄孩子更为成熟,但毕竟只有十岁,这是他人生中第一次出远门,面对父母渐行渐远的身影,他咬紧嘴唇,强忍泪水,情绪复杂而脆弱。在这样的情感波动中,他暗暗下定决心:等自己挣到了大钱,就立刻赶回家中,和父母再也不分开。这份决心既源于对家人的依恋,也承载着他年幼时对改变命运的朴素愿望。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "青牛镇的规模和主要街道布局是怎样的?","input": "","output": "青牛镇实际上只是一个规模较大的镇子,并非真正意义上的城市,当地人中只有住在附近山沟、见识较少的土人才会称其为“青牛城”。镇子呈长条形状,只有一条主街道,即东西走向的青牛街。镇上设施有限,仅有一家客栈——青牛客栈,位于镇子的西端,是过往商客若不想露宿野外时唯一可住宿的地方。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"},{"instruction": "成为七玄门内门弟子有哪些具体好处?","input": "","output": "成为七玄门内门弟子有以下具体好处:不仅可以免费习武,还能确保吃喝不愁,每月还能领取一两多的散银作为零花钱。此外,即使参加考验未能入选内门弟子,也有机会成为外门人员,专门替七玄门打理门外的生意,从而获得体面的身份和稳定的生活保障。","system": "你是凡人修仙传的解释员,如果你知道答案,就认真回答,如果不知道,就回答不知道。"}
]
  1. 启动LLamafactory 界面
    模型启动 加 export USE_MODELSCOPE_HUB=1(liunx\mac系统)、set USE_MODELSCOPE_HUB=1(window系统)
linux 多卡启动命令
export USE_MODELSCOPE_HUB=1CUDA_VISIBLE_DEVICES=0,1 llamafactory-cli webui通常会使用 nohup命令进行启动
export USE_MODELSCOPE_HUB=1
export CUDA_VISIBLE_DEVICES=0,1
nohup llamafactory-cli webui >20241119.log 2>&1 & # 前端启动
GRADIO_SERVER_PORT=6006 llamafactory-cli webui --model_name_or_path /root/autodl-fs/Qwen2.5-1.5B-Instruct --template qwen 
  • LLaMA Board在线下载至本地的模型存放路径为:/root/.cache/huggingface/hub 或者/root/.cache/modelscope/hub/下。如果在本地已经下载好模型,在Model path中可以直接指定模型在服务器上的实际存储路径,/root/autodl-fs
    在这里插入图片描述
  1. 点击开始,开始微调
    在这里插入图片描述
  • 后端GPU使用及后端日志记录
    watch -n 1  nvidia-smi
    

在这里插入图片描述
在这里插入图片描述

  • 打开导出目录,权重文件,可以通过加载微调后的模型文件,进行聊天。
    在这里插入图片描述
    在这里插入图片描述

安装TensorBoard监控

  • TensorBoard 是 TensorFlow 的可视化工具套件,用于理解、调试和优化机器学习模型的训练过程。它提供了一系列丰富的可视化仪表板,可以帮助开发者直观地监控模型训练过程中的各种指标,包括损失和准确率曲线、张量(Tensor)分布、模型图(Graphs)、嵌入向量的可视化等。
  • LLaMA Factory已集成Tensorboard支持,因此无需对代码进行额外修改即可接入训练数据信息。要在训练过程中有效利用Tensorboard进行数据监控,只需按照以下步骤执行操作:
  1. 安装依赖包

    pip install tensorFlow
    pip install tensorboard
    pip install tf-keras
    
  2. 添加训练参数
    在这里插入图片描述
    在这里插入图片描述

  • 在导出的目录下,执行命令,本地电脑访问http://localhost:6006/#scalars
    tensorboard --logdir runs --port 6006
    

在这里插入图片描述

http://www.dtcms.com/a/598135.html

相关文章:

  • 基于Springboot + vue3实现的渔具管理系统
  • 网站工作室设计数字营销的4个特征
  • Linux动静态库以及动静态链接
  • 一个关于python编程小白日记
  • 自己做一个外贸网站怎么样沪上装修排名前十有哪些品牌
  • 环保HJ212-2017协议Java代码解析
  • 专业零基础网站建设教学深圳极速网站建设定制
  • 黑马点评学习笔记10(优惠券秒杀下单优化(分布式锁的优化,Lua脚本))
  • 单页面网站有哪些内容吗电子商务就业岗位
  • 亚马逊云科技 Amazon Bedrock 持续壮大模型阵营:Qwen3 和 DeepSeek-V3.1 重磅上线
  • 同一个空间可以做两个网站么wordpress建设购物网站
  • 小县城做网站福田做商城网站建设多少钱
  • 东莞网站制作方案定制无锡网站制作哪家服务好
  • 做的的网站怎样上传如何做网站关键字优化
  • 【OpenCV + VS】图像像素的加减乘除操作
  • 那里可以做网站的吗wordpress修改文章链接
  • [Java EE] 多线程 -- 初阶(2)
  • 蓝牙钥匙 第89次 蓝牙钥匙未来发展趋势篇:与汽车电子架构演进深度融合
  • 网站建设解析2345网址导航开创中国
  • 营销型网站模版vi设计的目的
  • U++工程提取二进制工程
  • Zabbix告警配置全攻略:邮件+钉钉双保险
  • qq钓鱼网站制作微盟集团
  • 中国人做跨电商有什么网站自建冷库费用
  • 03|Langgraph | 从入门到实战 | 进阶篇 | 持久化
  • 如何将网站挂载域名网站建设的定位是什么意思
  • 知识管理工具sward上手指南:安装、配置与入门
  • 在Vivado中添加HLS IP后只显示路径无法显示可例化的IP核解决方式
  • 二分查找专题(十):“Z字形”的降维!当二分查找“失效”时
  • 响应式网站源码.net互联网行业的开发网站