当前位置：首页 > news >正文

语言大模型基础概念一（先了解听说过的名词都是什么）

news 2025/7/2 1:15:03

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

STF（Supervised Fine-Tuning）和RLHF（Reinforcement Learning from Human Feedback）是两种不同的模型训练方法，分别用于不同的阶段和目的。具体介绍参考SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别_sft和rlhf-CSDN博客

LoRA（Low-Rank Adaptation）

Lora（Low-Rank Adaptation）是一种新的模型微调技术。在预训练好的模型中引入并行的低秩矩阵，用于修正预训练模型的输出（有点像ResNet，增加新的参数用来生成预训练模型的残差）。具体介绍参考理解Lora微调只需一个公式-CSDN博客

语言大模型主体架构

参考

Decoder-Only、Encoder-Only、Encoder-Decoder 区别_decoder only-CSDN博客，语言大模型知识点简介_prefix decoder-CSDN博客

1. Decoder-Only 架构
描述：仅包含解码器部分，没有编码器。
应用： 通常用于生成任务，如语言模型和对话系统。
代表模型： GPT（Generative Pre-trained Transformer）
其他： prefix Decoder (输入为之前所有的输出, $Y_{t+1}=f([X_0, X_1,..., X_t])$ ）和 causal Decoder(输入为上一时刻的输出, $Y_{t+1}=f(X_t)$ ）。

2. Encoder-Only 架构
描述：仅包含编码器部分，没有解码器。
应用： 通常用于理解任务，如文本分类和情感分析。
代表模型： BERT（Bidirectional Encoder Representations from Transformers）

3. Encoder-Decoder 架构
描述：同时包含编码器和解码器部分。
应用：通常用于序列到序列（seq2seq）任务，如机器翻译和文本摘要。
代表模型： Transformer、T5

http://www.dtcms.com/a/13686.html

相关文章：

[Redis] Redis分布式锁与常见面试题

x64、aarch64、arm与RISC-V64：详解四种处理器架构

2024年博客之星年度评选—创作影响力评审+主题文章创作评审目前排名(2024博客之星陪跑小分队助力2024博客之星创作者成长)

从云原生到 AI 原生，谈谈我经历的网关发展历程和趋势

微服务与网关

数仓:核心概念,数仓系统(ETL,数仓分层,数仓建模),数仓建模方法(星型模型,雪花模型,星座模型)和步骤

mongodb

【Spring】什么是Spring？

Hive增量迁移方案与实操PB级

STM32系统架构介绍

使用 LangChain 对接硅基流动（SiliconFlow）API：构建一个智能对话系统

SpringBoot分布式应用程序和数据库在物理位置分配上、路由上和数量上的最佳实践是什么？

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署

Python Pandas（11）：Pandas 数据可视化

shell脚本自动安装MySQL8

使用Redis实现分布式锁，基于原本单体系统进行业务改造

python-leetcode 31.K个一组翻转链表

Selenium常用自动化函数

Jenkins 通过 Execute Shell 执行 shell 脚本七

读取本地excel并生成map，key为第一列，value为第二列

leetcode:171. Excel 表列序号（python3解法）

深入解析 STM32 GPIO：结构、配置与应用实践

DeepSeek 助力 Vue 开发：打造丝滑的通知栏（Notification Bar）

网络模型分层与对比

PostgreSQL 备库的延迟问题

哪吒闹海！SCI算法+分解组合+四模型原创对比首发！SGMD-FATA-Transformer-LSTM多变量时序预测

6.appender

MySQL、MariaDB 和 TDSQL 的区别

10 FastAPI 的自动文档

Golang的图形编程应用案例