当前位置: 首页 > news >正文

《大模型导论》笔记——模型微调

微调(fine-tuning)是一种在预训练语言模型的基础上使用目标任务数据进行训练的模型训练技术。

大模型首先在庞大的语料库进行自监督预训练,构建通用的基础模型。针对特定领域或特定任务,使用少量的额外的语料进行训练,以更好地适应特定领域或特定任务。

模型微调一般出现在大模型开发的后训练阶段。

在这里插入图片描述
emmm,拥有本国的大语言模型真的重要哇!~

在这里插入图片描述
监督微调的优势 能重复利用预训练模型的参数和结构,以及模型本身具有的相关知识,避免从头训练。
缺点依赖大量的标注数据,如果数据量不足,将导致微调效果大打折扣。

PEFT技术
宗旨是减少微调参数和降低计算复杂度来提升模型在特点任务的性能。lora,qlora等参数高效微调技术被相继提出。(看内容里面说用了矩阵, 再次感觉没有学好高数的匮乏,上学的时候考的分数也还可以,现在又还给老师了,想好好学习一下高数,有一段时间老做噩梦,梦见被老师上课提问高数,emmm,为了我做梦时间的幸福生活,有必要重新好好学一下数学 ~!要不然做梦了也没放过我,emmm)

http://www.dtcms.com/a/565278.html

相关文章:

  • 11.03
  • 从一个C++开发者看Java之(四)精准切入
  • 电子杂志网站建设网站设计师英文
  • 网站301在哪做青岛网上房地产网官网
  • 新安装的ubuntu 通过ssh远程登录
  • Dev-C++一些问题的处理
  • 网站落地页制作网站推广优化方案
  • 《嵌入式硬件(二十一):基于IMX6ULL的脉冲宽度调制(PWM)操作》
  • 网页设计与网站建设步骤高端网站定制建设公司哪家好
  • OpenCV计算机视觉实战(28)——深度学习初体验
  • 统计局网站集约化建设方案网站数据库有哪些
  • 自己动手写深度学习框架(快速学习python和关联库)
  • 从“算法思维”到“算子思维”:我在昇腾AI开发中的认知跃迁
  • 全球优秀企业网站工程公司资质等级
  • Hello epoll!
  • 泰安哪里做网站wordpress 男扮女
  • Linux】 性能调优实战:内核参数优化技巧
  • 网站建设厘金手指排名二一伊春网站制作
  • 做公众号关注网站网页安全防护怎么关闭
  • 【运维✨】云服务器公网 IP 迷雾:为什么本机看不到那个地址?
  • Swift 6.2 列传(第一篇):主线 Actor 的 “独尊令”
  • 基于AI大模型智能硬件--小智 AI 聊天机器人项目介绍
  • mybatis-plus SQL 注入漏洞导致版本升级引发的问题
  • 低空经济爆发期 遥感影像识别如何破解数据安全与效率困局
  • 哈尔滨做平台网站平台公司哪家好南通启益建设集团有限公司网站
  • 可以做婚礼视频的网站有哪些免费域名注册可解析
  • 网络抓包教学
  • Input getevent记录和InputReader,InputDispatcher启动
  • ESP01s通过blinker云端进行远程控制开关灯
  • 前端面试高频题解析