大模型常用术语
🧠 1. 模型参数(Model Parameters)
- 本质:大模型的“参数量”,本质是神经网络中可学习的权重与偏置总量,类比人类大脑中神经元连接的复杂程度,单位通常以十亿(B)计量。核心逻辑是:参数量越大,模型的“知识储备”越丰富,处理复杂问题(如数学推理、多模态生成)的准确率越高——这就像图书馆藏书越多,能解答的问题范围越广。
- 规模分级(典型模型):
参数量级 代表模型 能力边界 硬件需求 1-7B Llama-3-8B, Phi-3 文本生成/简单推理 消费级GPU(RTX 4090) 70B+ GPT-4, Claude 3 Opus 人类水平推理/多模态 千卡集群 + 3D并行 - 核心逻辑:
- ✅ 正向影响:参数量↑ → 知识储备↑ → 复杂任务(数学推理、创意生成)准确率↑(如100B模型比10B模型回答更详细)。
📜 2. 上下文长度(Context Window)
- 本质:指模型单次处理信息时,能覆盖的前后内容范围,相当于人类阅读时“一眼能看多少字”,在自然语言处理(NLP)、长文档分析等场景中起决定性作用——上下文越长,模型对“上下文逻辑”的理解越完整,避免出现“前文提过的信息后文遗忘”的问题。
- 场景适配:
Token长度 汉字容量 适用场景 2K ~1000字 客服对话、短文本分析 4K ~2000字 等文档处理,如新闻稿撰写、短篇报告分析,支持约2000汉字输入 8K ~8192字 长文分析场景,如行业报告摘要、小说章节创作,覆盖约4000汉字; 32K+ ~1.6万字 整书翻译、法律条文梳理 - 关键发现(斯坦福研究):
- 📉 U型性能曲线:模型对开头/结尾信息敏感,中间信息易丢失(如长文档中关键段落在中部时,准确率下降20%)。
- 优化方向:向量数据库检索(RAG)优先定位关键信息,而非盲目扩展上下文。
⚖️ 3. 量化(Quantization)
- 本质:是通过降低模型参数的数值精度,将高精度浮点运算(如FP32,32位浮点数)转换为低精度格式(如INT8、INT4整数,或FP8混合精度)的压缩方法。其核心逻辑是“牺牲微小精度,换取部署效率”——就像把高清视频(FP32)转成标清(INT8),画质略有下降,但存储体积变小、播放更流畅。
- 核心优势:
精度类型 存储占比 推理加速 适用硬件 FP32 100% 1x 科学计算卡 INT8 25% 2-4x 主流GPU(A100) INT4 12.5% 4-8x 边缘设备(Jetson) - 技术分类:
- PTQ(训练后量化):快速部署,精度损失5-15% → 适合实时任务(语音识别)。
- QAT(量化感知训练):精度损失<3% → 适合医疗/金融等高敏场景。
🍶 4. 蒸馏(Distillation)
- 本质:将大模型知识迁移至小模型,实现“轻量高仿”。
- 方法对比:
类型 优势 劣势 典型案例 跨模型蒸馏 融合多教师优势 依赖教师模型质量 R1-Distill-Qwen-7B(671B→7B) 同模型蒸馏 架构兼容性高 知识覆盖度受限 GPT-4 → DistillGPT-2 - 效果:小模型达教师模型75%性能,显存占用↓80%(如70B模型蒸馏后仅需14GB)。
🧱 5. Token
- 本质:文本处理的最小单位,相当于“语言积木”。 分词器决定计数差异:不同模型的分词器(Tokenzier)逻辑不同,导致相同文本的Token消耗不同。例如DeepSeek的分词器对中文优化更优,“人工智能大模型”会被拆分为1个Token,而部分国外模型可能拆分为“人工”“智能”“大模型”3个Token,相同文本的Token消耗相差3倍;
- 计费参考:
1 英文字符 ≈ 0.3 Token → "AI" = 0.6 Token 1 中文字符 ≈ 0.6 Token → "大模型" = 1.8 Token
- 计费参考:
🧩 6. MoE(Mixture of Experts)
- 让大模型“专人做专事”的混合专家架构
MOE架构的核心特点 - 稀疏激活(Sparse Activation):每个Token仅触发少数专家模块,如处理数学题时激活“代数专家”“几何专家”,处理文案时激活“修辞专家”“逻辑专家”,计算量比全参数模型(Dense模型)减少80%;
- 动态专家分配(Dynamic Routing):门控网络通过分析输入数据特征,实时选择最优专家。例如用户输入“写一份新能源汽车营销方案”,门控网络会优先激活“汽车行业专家”“营销策划专家”,确保输出贴合需求;
- 高可扩展性:可通过增加专家模块扩展模型能力,无需重构整体架构。例如DeepSeek为医疗场景新增“医学术语专家”“影像分析专家”,即可快速适配医疗问答任务;
效率优势显著:对比同参数量的Dense模型,MOE模型的推理速度快3-5倍,训练周期缩短40%,适合超大规模模型(如1T参数以上)的研发。
MOE的技术挑战 - 训练不稳定:若门控网络分配策略不当,可能导致部分专家“过载”、部分“闲置”,影响模型效果。DeepSeek通过“专家热度调节机制”,将专家利用率差异从40%缩小到15%,缓解了这一问题;
- 存储开销高:未激活的专家模块虽不消耗算力,但仍需占用显存。例如R1 671B模型,即使仅激活37B参数,仍需存储全部671B参数,对硬件显存要求较高;
- 实现复杂度高:需设计门控网络、专家负载均衡、分布式通信等模块,开发成本比Dense模型高30%,适合技术实力较强的企业。
🔍 7. RAG(Retrieval-Augmented Generation)
- 本质:给模型装配“实时知识外挂”,解决幻觉与知识滞后。 是解决大模型“知识滞后、领域不熟”的核心技术——相当于给模型装了一个“实时搜索引擎+专业知识库”,让模型在生成回答前,先从外部数据源(如企业文档、官网信息、最新政策)中检索相关信息,再结合检索结果生成准确内容。
- 工作流:
- 场景扩展:
- 多模态RAG:工业质检系统检索历史故障图,生成维修方案。
- 智能体协同:电商客服Agent自动调用库存API,实时回复订单查询。
- RAG的核心优势与场景
- 解决知识滞后问题:无需重新训练模型,通过更新检索库即可同步最新知识。例如金融领域的RAG系统,每天自动爬取证监会、交易所公告,确保模型生成的投资建议贴合最新政策;
- 提升领域专业性:通过“外挂领域知识库”,让通用大模型变身“行业专家”。例如医疗RAG系统接入《临床诊疗指南》《药品说明书》,模型就能给出符合临床规范的诊断建议;
- 降低幻觉风险:模型生成的内容可追溯到检索来源,减少“编造信息”的情况。例如法律RAG系统生成合同条款时,会标注引用的《民法典》条款编号,方便用户核查;
- 支持多模态扩展:除了文本检索,RAG还能对接图像、视频库。例如工业质检RAG系统,检索历史故障图片与解决方案,结合实时拍摄的设备照片,生成故障排查步骤。
🎮 8. RL(Reinforcement Learning)
- 本质:通过“试错学习”优化模型行为,核心方法 RLHF(人类反馈强化学习)。 让模型像人类一样,通过“做动作→拿反馈→调策略”的循环,自主优化能力,无需依赖海量标注数据。
- 流程:
- 人类标注优质回答 → 训练奖励模型。
- PPO算法调整模型 → 输出更符人类偏好(如GPT-4对话更自然)。
🤖 9. 智能体(Agent)
指能自主感知环境、做决策、执行任务的AI系统——区别于传统聊天机器人(只能对话),智能体可以像“办事员”一样,独立完成连续任务,甚至持续工作数天,无需人类干预。
- OpenAI的AI能力五阶段划分
按OpenAI对AI能力的分级,智能体处于第三阶段,是从“被动响应”到“主动执行”的关键跨越:
- Level 1:聊天机器人(Conversational AI):当前主流阶段,如ChatGPT、Claude,能进行自然语言对话,但仅能处理语言类任务,无自主办事能力;
- Level 2:推理者(Reasoners):能解决复杂问题(如数学证明、学术分析),但无法使用外部工具,相当于“只会思考不会动手”;
- Level 3:智能体(Agents):能自主调用工具、执行连续任务,如“帮用户订机票→预约酒店→生成行程单”,2025年被普遍认为是智能体发展元年;
- Level 4:创新者(Innovators):能辅助发明创造,如设计新药物分子、提出技术专利,推动科学进步;
- Level 5:组织者(Organizations):能管理整个组织的工作,如运营公司、协调团队,效率超越传统人类模式。
- 企业应用:DeepSeek企业套件对接ERP系统,自动完成销售分析→营销方案生成,效率↑40%。
🌐 10. 具身智能(Embodied AI)
-
本质:AI在物理环境中学习与交互(如机器人、自动驾驶)。
-
技术融合:
- 世界模型:学习物理规律(如重力碰撞)。
- 多模态感知:视觉+语音+传感器数据联合训练。
智能体、AIGC与AGI的关系
很多人会混淆这三个概念,其实它们是“目标-路径”的关系,可通过“餐厅类比”理解:
-
AGI(通用人工智能):相当于“全能餐厅老板”,能管理菜单设计、员工调度、客户服务、财务核算等所有事务,是长期理想目标,目前仍处于理论探索阶段;
-
AIGC(生成式AI):相当于餐厅的“创意厨师”,专注于“内容创作”(如设计新菜品、制作菜单),是AGI的“文艺分支”,已大规模商用(如文案生成、图像创作);
-
智能体(Agent):相当于餐厅的“服务员”,专注于“任务执行”(如感知顾客需求、推荐菜品、端送食物),是AGI的“行动分支”,目前部分场景已落地(如客服智能体、办公智能体)
从技术成熟度看:AIGC(商用化)>智能体(部分落地)>AGI(理论探索)。2025年1月,OpenAI已上线首款智能体Operator,支持餐饮推荐、活动预订、购物咨询等服务;国内DeepSeek也推出“企业智能体套件”,对接ERP、CRM系统后,可自动完成“销售数据统计→客户分层→营销方案生成”,某电商企业使用后,营销决策效率提升40%。
术语关系图
注:参考博客:大模型术语全解。