当前位置: 首页 > news >正文

LORA参数微调

文章目录

LORA中最重要的是缩放因子α\alphaα与秩rrr,它们共同决定LORA矩阵在推理中作用大小。其公式如下:
h=W0x+αrBAxh = W_0x+\frac{\alpha}{r}BAx h=W0x+rαBAx

关于这两个参数的关系,网上有很多不同的观点,有说他们应该是2倍关系,有人说要大很多,也有人说应该是其他的关系。这些都不重要的,可以做为参考,在实际中,最好您都试试,尽量多多的尝试吧。

原始博客

内容来自以下博客Finding the best LoRA parameters 作者基于自己的简易任务,做了一些实验并输出了实验内容。

结论

  • LORA原论文推荐,保持默认α\alphaα不变,调节rrr和学习率即可。
  • 固定rrr下,α\alphaα大值效果更好。
  • 固定rrr下,α\alphaα与学习率作用类似。

详细

1. α\alphaα越大越好

在博客中,他们分别固定r=128和r=2r=128和r=2r=128r=2下,分别尝试了α值为0.5,2,8,32,128,256,512\alpha值为0.5, 2, 8, 32, 128, 256, 512α值为0.5,2,8,32,128,256,512,神奇的是无论rrr的大小,都表明α\alphaα越大收敛越快,最终效果也越好。实验结果如下:
在这里插入图片描述
在这里插入图片描述

2. 调节学习率与α\alphaα作用一样

设置了三组实验,结果表明,lr与α\alphaα具有类似作用或者等价,其结果如图所示:
在这里插入图片描述

3. rsLORA在困难任务上有用

rsLORA主要是改动了整个缩放因子,整个新公式如下。改动原因是原作文发现,训练LORA效果不稳定,原因是缩放因子过小,导致难以发挥出来其作用。αr\frac{\alpha}{r}rα比较激进,导致整体的缩放因子较小,所以难以发挥大秩r的作用。
h=W0x+αrBAxh = W_0x+\frac{\alpha}{\sqrt{r}} BAxh=W0x+rαBAx
在简单任务下,rslora效果一般,但是在复杂训练场景下,rslora效果比较好。

http://www.dtcms.com/a/579045.html

相关文章:

  • 微信小程序开发——第四章:小程序的组件与模块化开发
  • 苹果牵手谷歌!Siri 将搭载 1.2 万亿参数 Gemini 模型
  • 水利工程建设信息网站鞍山网站怎么做出来的
  • python做网站好处网络平台推广的好处
  • 建设一个境外网站网站建设仟首先金手指13
  • 如何开网站详细步骤接做网站私活
  • python做网站入门做网站文字怎么围绕图片
  • 操作系统原理:实验1进程观测
  • WGCLOUD的监控数据会自动清理吗
  • 西双版纳建设局网站庆阳网站设计制作
  • 如何解决 pip install 安装报错 [WinError 32] 文件被占用(杀毒/占用进程)问题
  • 雄县阿里巴巴网站建设wordpress 字段插件
  • 网站ip解析wordpress控制列表页
  • Zabbix基于LNMP架构部署与管理
  • Nginx 代理apk下载,重定向问题
  • 企业自己的网站天津建站模板搭建
  • 网站建设开票内容官方网站内容可做证据吗
  • gazobo
  • 机器学习中交叉验证(CV)、CV fold(交叉验证折) 和 数据泄露
  • 制造业数字化转型实践:如何构建企业级项目数字化运营体系
  • RFID 赋能卫生陶瓷高压成型全流程数据采集与管控应用
  • 网站制作策划方案企业解决方案参考网站
  • 电子商务网站建设期末试题吉林省建设厅门户网站
  • Docker 常用命令与时区配置指南
  • 天津网站开发公司电话北京网站建设公司那个好
  • 常用网站网址网站优化企业排名
  • 国际物流公司网站有奖竞猜网站建设
  • 怎样创建网站教程长春高铁站
  • 如何网站推广广东建设协会网站首页
  • 如何上传网站源码小程序app开发软件定制