当前位置: 首页 > news >正文

语言大模型基础概念 一(先了解听说过的名词都是什么)

SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别

STF(Supervised Fine-Tuning)和RLHF(Reinforcement Learning from Human Feedback)是两种不同的模型训练方法,分别用于不同的阶段和目的。具体介绍参考SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别_sft和rlhf-CSDN博客

LoRA(Low-Rank Adaptation)

Lora(Low-Rank Adaptation)是一种新的模型微调技术。在预训练好的模型中引入并行的低秩矩阵,用于修正预训练模型的输出(有点像ResNet,增加新的参数用来生成预训练模型的残差)。具体介绍参考理解Lora微调只需一个公式-CSDN博客

语言大模型主体架构

参考

Decoder-Only、Encoder-Only、Encoder-Decoder 区别_decoder only-CSDN博客,语言大模型知识点简介_prefix decoder-CSDN博客

1. Decoder-Only 架构
描述: 仅包含解码器部分,没有编码器。
应用: 通常用于生成任务,如语言模型和对话系统。
代表模型: GPT(Generative Pre-trained Transformer)
其他: prefix Decoder (输入为之前所有的输出,Y_{t+1}=f([X_0, X_1,..., X_t]))和 causal Decoder(输入为上一时刻的输出,Y_{t+1}=f(X_t))。

2. Encoder-Only 架构
描述: 仅包含编码器部分,没有解码器。
应用: 通常用于理解任务,如文本分类和情感分析。
代表模型: BERT(Bidirectional Encoder Representations from Transformers)

3. Encoder-Decoder 架构
描述: 同时包含编码器和解码器部分。
应用: 通常用于序列到序列(seq2seq)任务,如机器翻译和文本摘要。
代表模型: Transformer、T5
 

相关文章:

  • [Redis] Redis分布式锁与常见面试题
  • x64、aarch64、arm与RISC-V64:详解四种处理器架构
  • 2024年博客之星年度评选—创作影响力评审+主题文章创作评审目前排名(2024博客之星陪跑小分队助力2024博客之星创作者成长)
  • 从云原生到 AI 原生,谈谈我经历的网关发展历程和趋势
  • 微服务与网关
  • 数仓:核心概念,数仓系统(ETL,数仓分层,数仓建模),数仓建模方法(星型模型,雪花模型,星座模型)和步骤
  • mongodb
  • 【Spring】什么是Spring?
  • Hive增量迁移方案与实操PB级
  • STM32系统架构介绍
  • 使用 LangChain 对接硅基流动(SiliconFlow)API:构建一个智能对话系统
  • SpringBoot分布式应用程序和数据库在物理位置分配上、路由上和数量上的最佳实践是什么?
  • 一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答:包括671B满血版和各个蒸馏版的部署
  • Python Pandas(11):Pandas 数据可视化
  • shell脚本自动安装MySQL8
  • 使用Redis实现分布式锁,基于原本单体系统进行业务改造
  • python-leetcode 31.K个一组翻转链表
  • Selenium常用自动化函数
  • Jenkins 通过 Execute Shell 执行 shell 脚本 七
  • 读取本地excel并生成map,key为第一列,value为第二列
  • 舞者王佳俊谈“与AI共舞”:像多了一个舞伴,要考虑它的“感受”
  • 下辖各区密集“联手”,南京在下一盘什么样的棋?
  • 上海一保租房社区亮相,首批546套房源可拎包入住
  • 上海比常年平均时间提前12天入夏,明天最高气温可达33℃
  • 梅花奖在上海|话剧《主角》:艺术与人生的交错
  • 董军在第六届联合国维和部长级会议上作大会发言