当前位置: 首页 > news >正文

003大模型基础知识

大模型分类:
技术架构: Encoder Only Bert
Decoder Only 著名的大模型都是
Encoder - Decoder T5
是否开源: 开源阵营: Llama DeepSeek Qwen
闭源阵营: ChatGpt Gemini Claude

语言模型发展阶段: 基于规则统计 n-gram:上下文比较短,数据稀疏,泛化能力差
神经网络语言模型:泛化能力差(解决) 数据稀疏(解决) RNN,LSTM
Transformer: Bert,GPT
LLM:参数以 10 亿计
评估指标: BLEU 精准率,需要有参考答案
ROUGE 召回率 需要有参考答案
PPL
大模型演进路线: Encoder-only 双向注意力机制,完形填空,阅读理解,Pre-train+下游任务fine-tuning
Decoder-only gpt:
gpt2:
gpt3:
Encoder-Decoder : T5


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
RLHF解决的是什么问题? 对齐问题,训练一个奖励模型

在这里插入图片描述
位置编码:
在这里插入图片描述

总结:

强化学习:
ChatGPT SFT :人类价值观对齐,
RLHF: 训练奖励模型, 人的参与是为了准备训练奖励模型的语料
强化学习:Agent,Environment,state,Policy,Reward
PPO:

不同大模型的差异:
位置编码: 传统Transformer,相对位置编码,旋转位置编码(用的最多),ALiBi
注意力机制:
LN:层归一化:
前馈神经网络:MOE


文章转载自:
http://bks.jopebe.cn
http://begorra.jopebe.cn
http://caber.jopebe.cn
http://azul.jopebe.cn
http://chordal.jopebe.cn
http://aswoon.jopebe.cn
http://adjustable.jopebe.cn
http://calcinator.jopebe.cn
http://blouse.jopebe.cn
http://botanically.jopebe.cn
http://asternal.jopebe.cn
http://beadswoman.jopebe.cn
http://aerogel.jopebe.cn
http://chelsea.jopebe.cn
http://chronologize.jopebe.cn
http://boyfriend.jopebe.cn
http://canteen.jopebe.cn
http://barracoon.jopebe.cn
http://apologetics.jopebe.cn
http://androstenedione.jopebe.cn
http://brownware.jopebe.cn
http://bannister.jopebe.cn
http://cholinomimetic.jopebe.cn
http://caesura.jopebe.cn
http://accelerator.jopebe.cn
http://backvelder.jopebe.cn
http://aiie.jopebe.cn
http://bladdernut.jopebe.cn
http://caterwauling.jopebe.cn
http://ceratodus.jopebe.cn
http://www.dtcms.com/a/280803.html

相关文章:

  • React 实现老虎机滚动动画效果实例
  • AutojsPro 9.3.11 简单hook
  • Pixel Reasoner:通过好奇心驱动的强化学习激励像素空间推理
  • 简单2步配置CadenceSkill开发编辑器,支持关键字高亮
  • [AI-video] Web UI | Streamlit(py to web) | 应用配置config.toml
  • (李宏毅)deep learning(五)--learning rate
  • 从底层技术到产业落地:优秘企业智脑的 AI 革命路径解析
  • NAT的核心原理以及配置
  • CCF-GESP 等级考试 2025年6月认证Python四级真题解析
  • RDMA over RoCE V2设计2:系统框架设计考虑
  • Datawhale AI夏令营 机器学习2.1
  • 详解低速容错CAN(附与高速CAN对比表)
  • RabbitMQ第三章(企业级MQ应用方案)
  • 基于uniapp+vue3封装的一个日期选择组件
  • 【图像处理基石】什么是解析力?
  • A*算法详解
  • Transformer江湖录 第九章:大道归一 - 总结与展望
  • 鸿蒙和Android知识点
  • 微信小程序翻书效果
  • 面试遇到的问题
  • 服务器上PHP环境安装与更新版本和扩展(安装PHP、Nginx、Redis、Swoole和OPcache)
  • 如何解决服务器频繁重启的问题?
  • Linux修改ssh默认端口,禁止root登录,禁止密码登录并同时开启公钥认证
  • session与cookie的区别
  • 55 个热门网络面试问题及答案
  • KMP (Knuth-Morris-Pratt) 算法详解
  • UE5多人MOBA+GAS 23、制作一个地面轰炸的技能
  • NE综合实验3:链路聚合、VLAN与Trunk、STP、DHCP、OSPF及PPP整合部署
  • Redis 数据持久化
  • 渲染设计图的空间革命:可视化技术如何重塑设计决策