当前位置: 首页 > news >正文

lora与模型的关系(小白入门了解)

lora是什么

lora的全称叫Low-Rank Adaptation of Large Models,意思是只训练模型中的一小部分权重,而不是动整个大模型,也可以简单的认为是对大模型的微调。

lora与大模型的关系

lora与大模型的关系可以举几个例子先有一个大概的理解:

把大模型比作某个开发软件,那么lora有点类似这个开发软件的插件,可以基于这个开放软件,进行一些额外的功能(也不完全正确)

把大模型比做一个人,lora是大模型的记忆补丁,大模型是一个遗忘速度非常快的人,因为这个人会的知识太多了,每次都无法在有限的时间内想回来这件事,于是,在这个人的面前,贴了一个记忆补丁,一旦做这件事,他就可以通过记忆补丁的时候,快速回忆起相关的技能,精确的完成这项任务。

为什么需要用lora

看这个表就知道了

对比项训练整个模型(小的)用LoRA 微调
训练时间几天~几周几十分钟~几小时
显存需求40GB+6~12GB一般足够
文件大小常用的一般在10GB+普遍在几百MB左右
是否破坏原模型可能损坏不会,安全叠加、随时关闭

另一方面,下载5-7个好用的大模型需要100GB左右,但是下载100个lora往往不到50GB,大模型配合lora使用,可以极大节省资源

http://www.dtcms.com/a/508699.html

相关文章:

  • xtuoj 公共的数
  • 删除西部数码网站管理助手嘟嘟嘟在线视频免费观看
  • 做网站要会写代码吗网站建设硬件投入表
  • 有官网建手机网站吗做自己域名的网站很贵吗
  • 网站建设方案书含合同做网站 内网怎么映射
  • jmeter性能测试完美入门
  • 余姚做网站的公司建筑人才网平台
  • 娱乐类网站wordpress男同
  • VSCode 配置 SSH 远程连接
  • 网站 主办单位性质 个人眉山建行网站
  • 网站建设与运营未来发展西安网站建设那家强
  • 134.FPGA常见管脚与时钟的约束方法
  • 宝安建网站多少钱wordpress本地打开慢
  • 国内开源代码网站传奇游戏开发
  • 新手做网站的几个必要步骤工作室图片 实拍
  • 中断NVIC
  • 自己也可以免费轻松创建一个网站营销网站制作
  • 苏州建网站多少钱网站访客跟踪
  • C标准库 - `<float.h>》详解
  • 解密 Vercel AI SDK:构建下一代 AI 应用的终极武器库
  • 开发网站语言推推蛙seo
  • 七宝做网站ps做电商网站图标
  • [css] flex布局中的英文字母不换行问题
  • wordpress爬虫采集惠州seo排名公司
  • 电白区建设局网站社交网站怎么做
  • 5 款 PDF 翻译工具深度测评:从格式到免费权限全解析
  • flash-attention连环问答--softmax 、safe softmax 、online softmax
  • 温州网站建设企业包装回收网站建设
  • 有没有做彩票直播的网站做一个网站开发项目有哪些阶段
  • 网站建设沛宣跨境电商自建站是什么意思