当前位置：首页 > news >正文

【datawhale】Agentic AI学习笔记

news 2025/11/11 8:05:45

文章目录

Introduction
- 定义definition
- 自主性degree of autonomy
- 组成composition
- 评估evaluation
反思功能的实现(Reflection Design Pattern)

基于datawhale的Agentic-AI共学以及吴恩达老师在 DeepLearning.AI 推出的 Agentic AI 系列课程

Introduction

定义definition

本质是AI，可以说是可以通过调用不同的agent来实现任务的AI

辨析：AI Agent 和 Agentic AI 区别

AI Agent本质是Agent，是可以利用AI的agent。FYI：Agent更多是强化学习中的概念，即与环境进行交互，执行action，得到rewards

如图(Sapkota et al.)，AI Agent接收用户设定的温度值，并自主控制加热或冷却系统以维持目标温度。虽然它能够表现出一定的自主性，比如学习用户的作息时间或在无人时减少能耗，但它仅在孤立状态下运行，执行单一且明确的任务，而不涉及更广泛的环境协调或目标推断。

Agentic AI 系统——多个专业化 Agent 协同互动，管理诸如天气预测、日常安排、能源定价优化、安全监控以及备用电源激活等多种功能。它们不仅仅是响应式模块，还可以动态通信、共享记忆状态，并协同实现高层次系统目标。

“非智能体”&“智能体”工作流

一些提升性能的有用的keys：

反思 (Reflection)
工具使用 (Tool Use)
规划 (Planning)
多智能体协作 (Multi-agent collaboration)

R. Sapkota, K. I. Roumeliotis, and M. Karkee, “AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges,” Information Fusion, vol. 126, p. 103599, Feb. 2026, doi: 10.1016/j.inffus.2025.103599.

自主性degree of autonomy

在这里插入图片描述

组成composition

在这里插入图片描述

评估evaluation

1、端到端评估 (End-to-end evals):衡量整个智能体最终输出的整体质量。
例如：评估一篇完整论文的最终得分。
2、组件级评估 (Component-level evals):衡量智能体工作流中单个步骤或组件的输出质量。

方法：

构建评估指标(量化指标便于统计，但要考虑到不可量化的因素)
LLM as judge

反思功能的实现(Reflection Design Pattern)

TBD

http://www.dtcms.com/a/592866.html

相关文章：

江苏国龙翔建设公司网站找工作网站建设

网站建设及在线界面设计

Aloha浏览器 7.10.1 |私人浏览器，极速上网，资源嗅探

多Agent协同-详解

Spring Boot 数据库操作实战：MyBatis 让 CRUD 像 “查奶茶库存” 一样简单

电脑五笔打字入门口诀：3天学会五笔打字拆字

自动驾驶中的B样条轨迹及B样条＜-＞贝塞尔转换实现避障

南阳市做网站网站开发是什么专业百度

做外包的网站有哪些问题最好玩的网站

阿尔及尔至广州直飞航线成功首航

太原网站建设找山西云起时北京做网站优化的公司

价值优先，敏捷致胜：超越“数据治理优先”的AI实施新范式

2025年下半年软考高级系统架构师题目和答案

基于多组学谱的疾病亚型分型与样本分类

怎么做免费网站被收录营销推广的目标

java使用poi-tl模版+vform自定义表单生成word

MATLAB实现CNN（卷积神经网络）图像边缘识别

PDF 智能翻译工具：基于硅基流动 API实现

中卫建设厅网站企业网站中( )是第一位的。

八股已死、场景当立(场景篇-分布式定时任务篇)

Sources中main、vendors、runtime、polyfills、scripts这些是什么？

webpack+vite,vue如何定义公共环境变量?

SourceMap知识点

iPhone Delta模拟器游戏资源包合集中文游戏ROM+BIOS+Delta皮肤附游戏导入教程

2.登录页测试用例

swagger和PostIn，开源免费接口管理工具选型指南

【Python办公】Excel按列拆分界面工具-calamine极速版(2)

基于TMS320F28069 DSP开发板实现RS485通信

UNCAUGHT_EXCEPTION CX_TREX_SERIALIZATION

AI开发革命：PyCharm科学计算模式重塑TensorFlow调试体验