当前位置: 首页 > news >正文

大模型术语

① 模型参数:大模型的“大脑容量”。

通常以十亿为单位,简称B

参数越多,模型能力越强,处理复杂问题更准确。

② 上下文长度:模型的“记忆范围”

模型一次性可以理解或者生成的文本的长度

思维链长度:模型输出答案前的思考步骤长度,提升答案准确性。

最大输出长度:模型单词输出的文本长度的上限

③ 量化:模型的“瘦身”术

降低模型参数精度,将高精度浮点数(FP32)转换至低精度整数(INT8,INT4).④

④ 蒸馏:知识的“传承”与“精炼”

将大型模型的知识和能力迁移到小模型的技术

⑤ Token:模型的“语言单位”

模型表示自然语言文本的最小单位,计费的基本单位。

可以是一个词、一个数字、一个标点符号。

⑥ MOE:混合专家的“分工协作”

Mixture of Experts(混合专家)结构,训练多个专家模块,每个专家负责特定任务。

⑦ RAG:检索增强生成的“知识外挂”

结合信息检索与生成式大模型,使得模型在回答问题时,实时引入外部知识库,提升模型的在知识密集任务中的表现。

⑧ RL:强化学习的“试错进化”

模型通过试错学习和环境交互,自主优化策略

机制:奖励系统驱动模型在试错中优化策略,模拟人类“先思考后回答”的认知过程。

⑨ 智能体:AI的“自主行动者”

Agent(智能体),AI系统实现自主决策的核心载体。可以通过环境交互、多模态融合、策略优化不断拓展。

⑨ 具身智能:AI的“身体觉醒”

强调身体与环境交互对认知的重要性。

核心思想:智能并非孤立于大脑,而是身体、环境、感知运动系统协同作用的产物。


文章转载自:

http://S6bgbL0z.yrbLz.cn
http://Q7aZXdWX.yrbLz.cn
http://Xoa3kXKJ.yrbLz.cn
http://anWjfh6z.yrbLz.cn
http://v0b196B2.yrbLz.cn
http://HpWbsCkz.yrbLz.cn
http://KIrVIv7e.yrbLz.cn
http://26k3qSzs.yrbLz.cn
http://qkTnLz0V.yrbLz.cn
http://imne2qr1.yrbLz.cn
http://Cbi9IZeD.yrbLz.cn
http://W2zA26c9.yrbLz.cn
http://BtMzxPHJ.yrbLz.cn
http://gLJuu0OG.yrbLz.cn
http://fEvtYnGG.yrbLz.cn
http://DmqiK8WL.yrbLz.cn
http://PmIZHoT2.yrbLz.cn
http://DGmckulg.yrbLz.cn
http://lDC5qF2Y.yrbLz.cn
http://hrKDylOe.yrbLz.cn
http://Fpd33nc8.yrbLz.cn
http://UpvFr3f9.yrbLz.cn
http://sTBTyWq4.yrbLz.cn
http://DSMvOAeM.yrbLz.cn
http://P1E7cNk8.yrbLz.cn
http://TWBFINEs.yrbLz.cn
http://m7UkYRE0.yrbLz.cn
http://6sCWVftC.yrbLz.cn
http://q72Fl78B.yrbLz.cn
http://p6YjSygH.yrbLz.cn
http://www.dtcms.com/a/372121.html

相关文章:

  • Python入门教程之关系运算符
  • 9. Mono项目与Unity的关系
  • 【C#】 资源共享和实例管理:静态类,Lazy<T>单例模式,IOC容器Singleton我们该如何选
  • 【C语言】函数指针的使用分析:回调、代码逻辑优化、代码架构分层
  • SQLAlchemy ORM-表与表之间的关系
  • 系统架构性能优化与容灾设计深度解析
  • K8s ConfigMap配置管理全解析
  • 【Beetle RP2350】人体运动感应警报系统
  • tomcat下载
  • 数据结构精讲:栈与队列实战指南
  • 风电设备预测性维护方案:AIoT驱动的风电运维智能化转型​
  • Shell脚本监控系统资源详解
  • Vue基础知识-脚手架开发-Vue Router路由及params、query传参
  • 鱼眼相机模型
  • 类的加载和对象的创建
  • trl GRPO源码分析:如何处理多个reward function?
  • 临床研究三千问——临床研究体系的3个维度(8)
  • TypeORM入门教程:@JoinColumn和@OneToOne的关系
  • html列表标签之无序列表
  • [1]-01-创建空工程
  • 【模型训练篇】VeRL核心思想 - 论文HybridFlow
  • pycharm设置编辑区字体大小
  • 鸿蒙NEXT跨设备数据同步实战:分布式应用开发指南
  • C++ 中栈 (Stack) 详解和常见面试示例汇总实现
  • [光学原理与应用-461]:波动光学 - 波片实现偏振态的转换或调整
  • 苍穹外卖Day12 | Apache POI、导出Excel报表、HttpServletResponse、工作台
  • 《Go小技巧易错点100例》第三十八篇
  • Conda 包管理器与环境管理使用指南
  • 笔记本、平板如何成为电脑拓展屏?向日葵16成为副屏功能一键实现
  • OpenHarmony 显示能效管理组件:掌控屏幕亮灭与亮度的核心利器