当前位置: 首页 > news >正文

LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境

训练或微调模型都是非常耗费算力的。如果电脑的配置不高,可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境,目前提供36小时免费运算,足够微调一个大模型了。

注册ModelScope(魔搭)社区账号(可能还要注册或认证阿里云账号),进入“我的NoteBook”:

我的Notebook · 魔搭社区

启动大概需要2分钟,等GPU环境启动好以后点击"查看NoteBook"进入。

开启后,会提示永久性数据只保存在/mnt/workspace/目录下。

魔塔社区内置了JupyterLab的功能,进入之后,可以找到 Notebook 标签,新建一个Notebook(当然你在terminal 里执行也没问题)。

如下箭头所示,点击即可创建一个新的 Notebook 页面。

2、克隆LLaMA-Factory

(如果使用本地电脑进行微调,以下步骤都可参考)

打开NoteBook的终端,在默认目录(/mnt/workspace/)下执行命令:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

建议使用--depth 1参数,将data及一些示例的训练数据下载下来,以便修改微调。

3、配置环境

3.1、创建虚拟环境

进入LLaMA-Factory目录:

cd LLaMA-Factory/

创建虚拟环境:

python -m venv env  # env为虚拟环境文件夹名称,可自定义,如llama-factory-env

激活虚拟环境:NoteBook终端是linux系统,激活虚拟环境命令如下(同macOS):

source env/bin/activate # env为创建的虚拟环境名称

如果是windows系统,使用如下命令激活虚拟环境:

env\Scripts\activate

注意:重启NoteBook后,记得先激活虚拟环境!

3.2、安装依赖

安装必要的依赖,如:

pip install --upgrade pip     # 更新pip
pip install bitsandbytes>=0.39.0 

3.3、安装LLaMA-Factory

使用以下命令安装:

pip3 install -e ".[torch,metrics]"

4、模型下载测试

4.1、下载模型

首先下载LLM大语言模型,这里使用QWen2.5-0.5B,参数5亿个,微调时间短,在低配置电脑上也能运行。

模型在魔搭社区上有,地址是:

相关文章:

  • 电动汽车直流快充充电桩AEV200-DC240M4的详细介绍
  • mysql-单一的事务--single-transaction选项
  • MyBatis进阶干货知识
  • 海康相机连接测试-极简版
  • K8s CoreDNS 核心知识点总结
  • AI 来袭:颠覆传统的数字营销指南
  • 我用 CodeBuddy 开发了一个颜色命名搜索器 —— ColorNameHub 的诞生记
  • Verilog HDL 语言整理
  • [特殊字符] 如何优雅地避免 SQL 多表 LEFT JOIN 造成的笛卡尔积放大问题?
  • 青少年编程与数学 02-019 Rust 编程基础 16课题、包、单元包及模块
  • C# RSA加密
  • 日语简单记录
  • 基于大模型预测的脑出血全流程诊疗技术方案
  • 服务器性能参数分析基础:磁盘-CPU-内存
  • ci/cd全流程实操
  • MySQL 8.0 OCP 1Z0-908 121-130题
  • ConcurrentSkipListMap的深入学习
  • 前端方法的总结及记录
  • 使用DDR4控制器实现多通道数据读写(十二)
  • (7)python开发经验
  • 长三角体育节回归“上海时间”,首次发布赛事旅游推荐线路
  • 张国清将赴俄罗斯举行中俄“长江—伏尔加河”地方合作理事会第五次会议和“东北—远东”政府间合作委员会双方主席会晤
  • 2000多年前的“新衣”长这样!马王堆文物研究新成果上新
  • 河南:响鼓重锤对违规吃喝问题露头就打、反复敲打、人人喊打
  • 奥运“四朝元老”华天回国参赛,伤势未愈谨慎出战全国锦标赛
  • 俄谈判代表团已抵达土耳其,谈判预计在莫斯科时间10时左右开始