当前位置: 首页 > news >正文

解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs- OpenAI AGI 五阶段

解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs- OpenAI AGI 五阶段

在这里插入图片描述
然后第三个阶段就是agent,注意这里面的agent和我们说应用程序开发的这个agent是一个不同的概念。AI just can take actions autonomously自动的去执行一些动作。但大家像今天我们看到的computer use for the browser use,其实这些都是reasoning和就thinking和action,他们都统一在大模型之下的一个很经典的一个表现。

我在这里就是要清晰化一点,注意我们这边说的是五个模型通用AG,这是从模型五个阶段AGI,这是从模型的角度,也就是说如果我们看Agent的话,它是既具有思考的能力,就thinking的这个过程或者这种能力。同时他又知道基于在思考或者说他的具体的分析,他知道下一步最好的这action是什么。所以它会变成一个什么样的呢?它就变成了thinking action,这显然是一种更高的一种发展水平了,高于这个reasoners或者reasoning models,后面就innovator和organizations。这些我们就暂时不多说。

为什么暂时不多说这些层面的东西?是因为大家应该知道这个innovation主要是invention venture和creativity,这些会面临很多未知的环境,或者说例如说一些现在看上去解决不了的数学问题等等之类的。在你获得可控灵活性以及具有自我学习能力之前,这应该是一件很难达到的一种状态。但有可能通过大模型的这种幻觉,可能意外的破解了一些问题。但是你想复制它也会很困难,所以这肯定还需要很长的时间去走。

那你有了这个innovator之后,在这之上构建的这个organizations级别就AI that can manage complex。行,所以这个是不是我们现在看见的一些做A进的框架说我们现在已经是organization级别的。我们现在谈的chatbot reasoners agent innovations organizations,我们都是从models的角度去谈的。而大家现在看见的agent或者说这个organization级别的这个agent,它都是用程序的级别或者是系统的级别,也就是工程engineering的级别,而不是说model s的级别。显然从model s的级别,是一个更根本的以及更具有通用价值的。因为你这个模型本身如果具有这个能力的话,你在之上构建的任何能力都会极大的增强。

所以我希望这个地方,关于这一点,从模型的视角,可从应用程序的视角,或者说从agentciaI的这个视角,大家要进行稍微思考,否则的话你可能是想,我们现在不是都是已经有这个Agent了吗?甚至有这个organization级别的这些agents等等之类的。 这个是跟大家分享的整个OpenAI它的AGI到5个基本的阶段。但在这里面其实有一个非常重要的点,就是你要通往AGI。你谈了五个阶段,那靠什么去实现AGI?

这个AGI就是artificial general intelligence,它怎么变成general intelligence?我相信大家多少会听到你要实现AGI,一般都会要借助强化学习。我觉得通过刚才分析,因为我们课程所有的内容都环环相扣的。就是说你谈到这个innovator,你谈到invention和creativity,他这个是什么意思?是你训练完模型的时候,你数据根本就没涉及到这什么样的内容你模型的数据都没有,

你在训练模型的时候,训练数据中没有这些相关的数据,或者说能力,或者说模式。然后你现在的模型要具备这种the innovators级别的这种capabilities。那这个时候我们就不能说简单的通过标注数据或者训练更多的数据来达到。这个时候我们就需要强化学习。为什么说强化学习能做到,我们称之为invention和creativity,或者是outdoor distribution等等之类,这些都将面临新的情况的novel scarious的能力。然后你这个能力你自己本身如果就reason capability,就第二阶段的reasoners,然后你这边还可以take actions,autonomy。那你本身显然已经进入了更高的这种境界,就是智能的这种境界。

好,现在我们的核心问题是有一些同学会知道要才能强化学习。为什么才能强化学习? 例如从这个其实你从第一阶段开始以后,就是chatbot,这个阶段开始以后,后续的这每个阶段的核心都是强化学习。为什么是这样?

在这里插入图片描述

相关文章:

  • 实验六:按键模拟控制实现
  • 浏览器相关
  • FPGA: Xilinx Kintex 7实现PCIe接口
  • 几种运放典型应用电路
  • OracleLinux7.9-ssh问题
  • Windows10安装WSA
  • 涨薪技术|0到1学会性能测试第64课-SQL监控之Trace选项
  • 2025 uniapp的请求封装工具类以及使用【拿来就用】
  • 基于大模型的TIA诊疗全流程智能决策系统技术方案
  • 【三维重建】三维场景生成:综述
  • Cesium.Ray 知识详解,示例代码
  • Jmeter 安装包与界面汉化
  • 【PostgreSQL数据分析实战:从数据清洗到可视化全流程】附录-C. 常用SQL脚本模板
  • 高压启动电路--学习记录
  • 蓝桥杯13届国B 完全日期
  • 正则表达式(二)-高级应用_谨慎使用
  • 《AI驱动的智能推荐系统:原理、应用与未来》
  • 微信小程序之将轮播图设计为组件
  • 鸿蒙NEXT开发动画案例8
  • wordcount程序
  • 因操纵乙烯价格再遭诉讼,科莱恩等四家企业被陶氏索赔60亿
  • 第十届影像上海博览会落幕后,留给中国摄影收藏的三个问题
  • 北京航空航天大学首个海外创新研究院落户巴西
  • 著名连环画家庞邦本逝世
  • 美国拟向阿联酋和沙特AI公司出口数十万枚芯片
  • 英国收紧移民政策,技术工作签证、大学招生面临更严要求