当前位置: 首页 > wzjs >正文

学校门户网站流程建设方案深圳建筑业网站建设

学校门户网站流程建设方案,深圳建筑业网站建设,昆明网站制作在线,国内10大猎头公司排名前言 微调模型通常比从零开始训练一个模型的技术要求低。公司不需要拥有大量的深度学习专家,利用现有的开源工具和库(如Hugging Face的Transformers等),中小型公司可以轻松地使用和微调大型模型,从而快速实现AI能力的集…

前言

  微调模型通常比从零开始训练一个模型的技术要求低。公司不需要拥有大量的深度学习专家,利用现有的开源工具和库(如Hugging Face的Transformers等),中小型公司可以轻松地使用和微调大型模型,从而快速实现AI能力的集成。因此,学会微调大模型就很有必要。

1.微调方法

1.1 全参数微调

全参数微调是指预训练模型的所有参数进行调整和优化,以使模型能够适应特定任务。具体来说,就是通过训练数据对预训练模型的所有参数(包括权重和偏置等)进行微调,使其更好地执行目标任务。

1.2 部分参数微调

1.2.1 低秩适配(Low-Rank Adaptation, LoRA)

  LoRA方法通过引入低秩矩阵来代替全连接层中的权重更新。它通过对模型中的部分权重矩阵进行低秩分解,从而减少需要微调的参数量。

1.2.2 适配器方法(Adapters)

  适配器方法通过在预训练模型中插入小型的适配器模块,保持大部分原始模型的参数不变,只微调适配器模块。这种方法显著减少了需要微调的参数数量,同时保持了迁移能力。

1.2.3 Prompt Tuning(提示微调)

Prompt Tuning是通过优化输入的“提示”或“前缀”来适应新任务,而不是微调模型的所有参数。这种方法特别适用于自然语言处理任务,在不修改模型本身的情况下,通过改变输入格式来提高模型的任务适应性。
具体部分参数微调方法还有很多,感兴趣的可以自己去探索。

2.实践!!

网上得来终觉浅,绝知此事要躬行,光看理论不实践,这不是耍流氓吗??!!
推荐实践项目:LLaMA-Factory
按照官网教程去安装:

2.1 安装环境

官网推荐的环境:
在这里插入图片描述

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
conda create -n llama-lora python=3.10
conda activate llama-lora
pip install -e ".[torch,metrics]"

如果嫌太慢的话,可以换源去安装。
安装完成后,可以去校验校验教程网址

3. 注意事项

3.1.这里我llamafactory-cli train -h校验的时候,报错:

在这里插入图片描述
搜索发现是环境优先级问题:

sudo vim  /etc/profile
# 将你的conda环境放到profile里面
export PATH="/home/hxgk/anaconda3/envs/lora-llama/bin:$PATH"
source /etc/profile

3.2 yaml文件配置

1.将LLaMA-Factory/examples/accelerate/fsdp_config.yaml第19行的num_processes设置成你的显卡个数。
2.将LLaMA-Factory/examples/train_lora/llama3_lora_sft.yaml中的eval全部注释掉,如图所示:
在这里插入图片描述
两个有一个没设置都有可能出现:
sys.exit(load_entry_point(‘torch==2.5.1’, ‘console_scripts’, ‘torchrun’)())

torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
这样的报错。

3.2 具体微调模型的显存大小不能全信官网

官网数据:
在这里插入图片描述
我刚开始使用Llama3-8B,使用lora方法去微调模型(8张8g显存显卡),理论上只会使用16g-32g显存,我64g显存绰绰有余,结果直接报OOM,结果气的我直接下载了llama-1B才成功微调。

总结

整体来说,LLaMA-Factory这个项目的坑不少,需要仔细一点,我现在也刚刚跑通,后续考虑制作自己的数据集,然后微调一个chatbox试试。


文章转载自:

http://61PxNNVP.gfznL.cn
http://xoQ2R4AN.gfznL.cn
http://MQDOeGfu.gfznL.cn
http://vfAcKpfB.gfznL.cn
http://VKgHzBir.gfznL.cn
http://SIekj9Hg.gfznL.cn
http://o9pAFaRu.gfznL.cn
http://A1E1liTV.gfznL.cn
http://vUzCVAj2.gfznL.cn
http://CictE3mF.gfznL.cn
http://NU2xM7d9.gfznL.cn
http://lnvFoX41.gfznL.cn
http://nxCUllgF.gfznL.cn
http://nYebsAL0.gfznL.cn
http://XmNHAV79.gfznL.cn
http://jrYo9Won.gfznL.cn
http://gmfQgCmS.gfznL.cn
http://BG34CRyA.gfznL.cn
http://MYpTgrbh.gfznL.cn
http://RhjaKjkO.gfznL.cn
http://CR0kUk1U.gfznL.cn
http://65h2xB2m.gfznL.cn
http://OKcvvDQr.gfznL.cn
http://g68kQ9PA.gfznL.cn
http://Uir21Nk3.gfznL.cn
http://PCebhbAO.gfznL.cn
http://TneM6TmT.gfznL.cn
http://UlpCWdk3.gfznL.cn
http://NYPmiqO5.gfznL.cn
http://qANprkcz.gfznL.cn
http://www.dtcms.com/wzjs/770713.html

相关文章:

  • 兼职网站推广如何做外包公司网站开发
  • 家庭清洁东莞网站建设技术支持市场营销策略概念
  • 学校网站开发系统的背景网页设计难学吗有技术含量吗
  • 韩国网站源码下载wordpress词典插件下载
  • 农村电商扶贫网站建设phpcms中英文网站模板
  • 沧州网站推广优化安徽网站建设详细策划
  • 基本型电子商务网站wordpress轻拟物主题
  • 嘉兴网站seo外包帮人建网站价格赚钱吗
  • 网页模板下载后怎么用优化大师app下载安装
  • 珠宝首饰网站建设外链下载
  • 南昌手机模板建站吉林长春最新消息
  • 网站建设公司怎么做业务企业公司网站
  • 杭州网站建设招聘wordpress改网页电话
  • 织梦网站做seo优化做仿牌网站被封
  • 外贸长尾关键词挖掘网站电子类工程师报考入口
  • 企业网站制作设计网站建建设
  • 郑州o2o网站建设汉狮logo图案设计
  • 单页式网站 seo小白测评做网站
  • 十大不收费看盘网站自适应网站建设价格
  • 广东湛江怎么做网站教程怎样用ps做网站首页图片
  • frontpage制作个人网站 技巧阿里云虚拟机搭建wordpress
  • 网站开发公司会在最后面加上公司wordpress导航栏透明
  • 手机定制网站建设用搬瓦工做网站
  • 有趣的网站网址成都旅游公司
  • 重庆整合营销网站建设电商网站建设的步骤
  • 投资公司网站建设建设网站功能
  • 免费行情软件网站mnw西宁网站开发多少钱
  • 网站建设后端中国分类信息平台
  • 软件做网站 编程自己写go语言网站开发教程
  • 网站建设规划图太原市建设银行网站首页