当前位置: 首页 > news >正文

建设网站加盟苏州园区做网站公司

建设网站加盟,苏州园区做网站公司,上海网站建设千元漂亮,无锡那家网络公司做网站好前言 微调模型通常比从零开始训练一个模型的技术要求低。公司不需要拥有大量的深度学习专家,利用现有的开源工具和库(如Hugging Face的Transformers等),中小型公司可以轻松地使用和微调大型模型,从而快速实现AI能力的集…

前言

  微调模型通常比从零开始训练一个模型的技术要求低。公司不需要拥有大量的深度学习专家,利用现有的开源工具和库(如Hugging Face的Transformers等),中小型公司可以轻松地使用和微调大型模型,从而快速实现AI能力的集成。因此,学会微调大模型就很有必要。

1.微调方法

1.1 全参数微调

全参数微调是指预训练模型的所有参数进行调整和优化,以使模型能够适应特定任务。具体来说,就是通过训练数据对预训练模型的所有参数(包括权重和偏置等)进行微调,使其更好地执行目标任务。

1.2 部分参数微调

1.2.1 低秩适配(Low-Rank Adaptation, LoRA)

  LoRA方法通过引入低秩矩阵来代替全连接层中的权重更新。它通过对模型中的部分权重矩阵进行低秩分解,从而减少需要微调的参数量。

1.2.2 适配器方法(Adapters)

  适配器方法通过在预训练模型中插入小型的适配器模块,保持大部分原始模型的参数不变,只微调适配器模块。这种方法显著减少了需要微调的参数数量,同时保持了迁移能力。

1.2.3 Prompt Tuning(提示微调)

Prompt Tuning是通过优化输入的“提示”或“前缀”来适应新任务,而不是微调模型的所有参数。这种方法特别适用于自然语言处理任务,在不修改模型本身的情况下,通过改变输入格式来提高模型的任务适应性。
具体部分参数微调方法还有很多,感兴趣的可以自己去探索。

2.实践!!

网上得来终觉浅,绝知此事要躬行,光看理论不实践,这不是耍流氓吗??!!
推荐实践项目:LLaMA-Factory
按照官网教程去安装:

2.1 安装环境

官网推荐的环境:
在这里插入图片描述

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
conda create -n llama-lora python=3.10
conda activate llama-lora
pip install -e ".[torch,metrics]"

如果嫌太慢的话,可以换源去安装。
安装完成后,可以去校验校验教程网址

3. 注意事项

3.1.这里我llamafactory-cli train -h校验的时候,报错:

在这里插入图片描述
搜索发现是环境优先级问题:

sudo vim  /etc/profile
# 将你的conda环境放到profile里面
export PATH="/home/hxgk/anaconda3/envs/lora-llama/bin:$PATH"
source /etc/profile

3.2 yaml文件配置

1.将LLaMA-Factory/examples/accelerate/fsdp_config.yaml第19行的num_processes设置成你的显卡个数。
2.将LLaMA-Factory/examples/train_lora/llama3_lora_sft.yaml中的eval全部注释掉,如图所示:
在这里插入图片描述
两个有一个没设置都有可能出现:
sys.exit(load_entry_point(‘torch==2.5.1’, ‘console_scripts’, ‘torchrun’)())

torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
这样的报错。

3.2 具体微调模型的显存大小不能全信官网

官网数据:
在这里插入图片描述
我刚开始使用Llama3-8B,使用lora方法去微调模型(8张8g显存显卡),理论上只会使用16g-32g显存,我64g显存绰绰有余,结果直接报OOM,结果气的我直接下载了llama-1B才成功微调。

总结

整体来说,LLaMA-Factory这个项目的坑不少,需要仔细一点,我现在也刚刚跑通,后续考虑制作自己的数据集,然后微调一个chatbox试试。

http://www.dtcms.com/a/396317.html

相关文章:

  • 网站服务器端口设置房屋建筑学课程设计图纸
  • 做昆特牌的网站网站内容的设计与实现
  • 网站建设栏目这一块怎么写深圳做互联网教网站公司
  • 什么是网站实施wordpress 默认播放器
  • 东明住房和城乡建设局网站小白怎么做无货源电商
  • 可以看的网站都有哪些网页设计表格跨行代码
  • 学校信息化网站建设广告策划书前言范文
  • 网页制作制作网站公司部门职位
  • 自己做的网站如何上首页室内设计师的工作内容
  • 网站建设 调研报告动画制作软件ae
  • 网站优化柳州网站后台空间满了怎么办
  • 网站建设工程师面试对自己的前景规划阿里接外包吗网站开发
  • 注册公司流程和费用2020网站建设seo需求文档
  • 安装Python3及使用openpyxl和xlrd将Excel自动生成多语言
  • 网站开发好不好wordpress 更换编辑器
  • 微小店网站建设比较好wordpress 支付 小程序
  • 网站建站需要什么软件邢台pc网站开发
  • *Linux - 文件查找与打包压缩(纯干货版)
  • 网站建设规划方案菜单设计制作网站
  • 网站文章怎么更新时间微信公众号粉丝下单
  • 顶尖物理高校研究所,引进Infortrend普安科技块级SAN存储
  • 韩雪冬 网站wordpress手机导航栏模板
  • 天津网站优化公司做个简单的网站多少钱
  • 浙江企业响应式网站建设设计做少儿培训网站的公司
  • 仿站小工具+wordpress联雅网站建设
  • jsp网站建设课程设计厦门城乡住房建设厅网站
  • 基于目标导向扩散模型与影响函数的EHR数据生成方法
  • 公司网站怎么优化电商网站设计工作内容
  • 网站建站公司有必要做吗互联网产品运营推广方案
  • ansible安装与模块使用