当前位置：首页 > news >正文

大模型应用开发第五讲：成熟度模型：从ChatGPT（L2）到未来自主Agent（L4）

news 来源：原创 2025/5/30 14:29:31

大模型应用开发第五讲：成熟度模型：从ChatGPT（L2）到未来自主Agent（L4）

资料取自《大模型应用开发：动手做AI Agent 》。
查看总目录：学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章：DeepSeek R1本地与线上满血版部署：超详细手把手指南

Agent成熟度模型详解：从「智能客服」到「科幻管家」

用手机进化史类比AI Agent发展路径，结合书中技术框架梳理阶段特征

一、成熟度分级表（先看全局）

级别	名称	能力类比	典型特征	案例参考
L1	基础对话模型	功能机（只能打电话）	单轮问答，无上下文记忆	早期客服机器人
L2	ChatGPT级（初级Agent）	智能手机（装App扩展能力）	简单规划+调用单个工具	GPT-4联网版
L3	专业领域Agent	智能手表（健康监测）	多步骤决策+领域工具链协作	医疗诊断Agent
L4	自主Agent	科幻管家（贾维斯）	跨系统协作+动态学习+自我优化	电影《钢铁侠》AI

二、逐级拆解（含技术原理与案例）

▶ L2级：会查资料的「实习生」

核心特征：

有限规划：拆解简单任务（如“查天气→推荐穿搭”）[2][5]
单一工具：每次调用1个接口（如地图API）[5]
线性执行：出错需人工修正（订单失败就卡住）[6]

生活案例：旅行清单助手

用户说：“下周末去杭州要带什么？”
1️⃣ 查杭州天气（调用天气API → 显示有雨）[5]
2️⃣ 生成清单：雨伞、薄外套 → 结束任务[6]

▲ 线性决策流程（第5章Function Calling示例）

▶ L3级：行业专家级的「部门主管」

技术突破：

多级规划：任务树分解（如看病→挂号→检查→开药）[1][6]
工具链协作：连续调用多个系统（医保计算+药房库存查询）[6]
异常处理：预算超支自动切换方案（如改用平价替代药）[6]

医疗Agent实战流程：
1️⃣ 患者输入症状 → 拆解为[挂号科室→检查项目→取药] [1]
2️⃣ 调用医院HIS系统查号源 → 推荐最近三甲医院 [5][6]
3️⃣ 检查报告解读 → 自动对比历史病例库 [5]
4️⃣ 开药时检测医保余额 → 不足时触发短信提醒 [6]

▲ 多工具协作流程（第6章ReAct框架）

▶ L4级：全能型的「CEO助理」

质变特征（相比L3）：

动态学习：从用户反馈优化策略（如记住用户常选航空公司）[4]
跨系统协同：同时调度物流+支付+供应链系统 [6]
自主纠错：航班取消时自动改签+重订酒店+通知客户 [4][6]

案例：情人节鲜花危机救援
1️⃣ 感知异常：物流系统报警 → 50%库存损毁[6]
2️⃣ 动态规划：
▸ 查找备用供应商（调用3个鲜花平台API）
▸ 比价后锁定本地批发市场现货 [6]
3️⃣ 多线程执行：
▸ 向批发商付款 → 调用企业支付接口
▸ 同步更新客户订单 → 发送延迟补偿券 [6]
4️⃣ 经验沉淀：将本次方案存入危机应对知识库 [2][4]