【datawhale】Agentic AI学习笔记
文章目录
- Introduction
- 定义definition
- 自主性degree of autonomy
- 组成composition
- 评估evaluation
- 反思功能的实现(Reflection Design Pattern)
基于datawhale的Agentic-AI共学以及吴恩达老师在 DeepLearning.AI 推出的 Agentic AI 系列课程
Introduction
定义definition
本质是AI,可以说是可以通过调用不同的agent来实现任务的AI
辨析:AI Agent 和 Agentic AI 区别
AI Agent本质是Agent,是可以利用AI的agent。FYI:Agent更多是强化学习中的概念,即与环境进行交互,执行action,得到rewards
如图(Sapkota et al.),AI Agent接收用户设定的温度值,并自主控制加热或冷却系统以维持目标温度。虽然它能够表现出一定的自主性,比如学习用户的作息时间或在无人时减少能耗,但它仅在孤立状态下运行,执行单一且明确的任务,而不涉及更广泛的环境协调或目标推断。
Agentic AI 系统——多个专业化 Agent 协同互动,管理诸如天气预测、日常安排、能源定价优化、安全监控以及备用电源激活等多种功能。它们不仅仅是响应式模块,还可以动态通信、共享记忆状态,并协同实现高层次系统目标。
“非智能体”&“智能体”工作流
一些提升性能的有用的keys:
- 反思 (Reflection)
- 工具使用 (Tool Use)
- 规划 (Planning)
- 多智能体协作 (Multi-agent collaboration)
R. Sapkota, K. I. Roumeliotis, and M. Karkee, “AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges,” Information Fusion, vol. 126, p. 103599, Feb. 2026, doi: 10.1016/j.inffus.2025.103599.
自主性degree of autonomy

组成composition

评估evaluation
1、端到端评估 (End-to-end evals):衡量整个智能体最终输出的整体质量。
例如:评估一篇完整论文的最终得分。
2、组件级评估 (Component-level evals):衡量智能体工作流中单个步骤或组件的输出质量。
方法:
- 构建评估指标(量化指标便于统计,但要考虑到不可量化的因素)
- LLM as judge
反思功能的实现(Reflection Design Pattern)
TBD


