当前位置: 首页 > wzjs >正文

自己的网站怎么制作移动网站设计

自己的网站怎么制作,移动网站设计,视频教学网站开发,青岛气象站建站时间AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving 1. 引述 这是一篇自动驾驶领域的论文。我对这篇论文主要感兴趣的点在于其对于工具调用(Tool Call)的设计。这一点同…

AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving

1. 引述

这是一篇自动驾驶领域的论文。我对这篇论文主要感兴趣的点在于其对于工具调用(Tool Call)的设计。这一点同时也被设计在了其强化微调时的奖励函数上。

2. 方法

2.1 思维链设计

论文思维链的每个步骤都被组织成五个要素:

  • 所选工具(显式输出在思考过程中,也就是 <tool>)
    模型在该步骤决定要调用的外部模块/工具名称(比如 “Open-Vocab Detector” 或 “Depth Estimator”),或者标记不调用任何工具。

  • 子问题 
    针对当前推理目标,模型提出的一个更细粒度的问题。

    例如在判断能否左转时,子问题可能是“前方来车速度如何?”或“左侧车道上有没有行人?”

  • 不确定性标记
    一个布尔值,标记“内部知识能否直接回答子问题”:

    • 如果模型内部已有足够知识,可直接判断,则标记为 False

    • 否则标记为 True,表示需要调用工具辅助判断。

  • 初步答案

    • 当不确定性标记为 False 时,模型直接给出问题的回答;

    • 若不确定性标记为 True,此处留空,等待工具返回结果后再进行下一步推理。

  • 下一步动作选择
    指示是“继续推理”(Continue Reasoning)还是“结束推理并输出最终答案”(Conclude)。

2.2 工具调用

在开放词汇目标检测、轨迹预测等指定任务上,专门针对这方面的模型必然效果比语言模型好。如果让 LLM 去做这些任务,那么大概率是会生成幻觉的,就好比早期的 GPT,你问它数学题,它输出错误答案(幻觉);而现在的 GPT 遇到复杂的数学问题会直接求助 Python,这就是工具调用(Tool Call)。

上图是论文的一个对比实验图,对比使用 tool 和不使用 tool 的效果。

论文的附录里面写了所有使用的 tool,而结果上这些 tool 是一个个的函数。在 SFT 阶段,论文对大模型输出形式进行微调(预热),在微调输出思维链那一块儿就用 <tool> 来指定调用哪个函数。

2.3 奖励函数

论文在摘要提到他们的创新包括: GRPO 微调、调用工具、思维链。事实上,GRPO 微调的论文现在一抓一大把,微调不是创新,微调的设置才是创新,确切来说(主要)是奖励函数的设计。

工具调用和思维链这两个创新需要和微调关联起来,意思就是说奖励函数的设计是包括了这两个创新点。

论文的奖励函数设计思路如下:

  • 最终答案奖励:答案正确就基于正反馈
  • 推理步骤奖励:思维链的推理是否正确(判断答案是不是蒙出来的,或者答案错误但是思路是对的)
  • 工具调用奖励:在 “解题” 过程中,是否用了正确的辅助工具

具体的设计公式(给多少点奖励)论文并未提及。

2.4 方法流程

论文首先是构建了一个数据集。使用特定提示模板,让 GPT-4o 在每一步推理中决定是否调用工具,并生成“子问题 → (工具调用)→ 中间答案 → 下一步动作”的完整链式思维轨迹。

接着使用千问7B作为 LLM,使用 SFT 对模型进行预热,也就是规范模型输出格式,并告诉模型其将要面临的具体任务(比如这个数据集都是自动驾驶的数据,那么模型在监督微调之后,后续的回复就会更倾向自动驾驶)

最后在实际推理时,模型根据每步的“不确定”标记,实时决定是否调用工具,并将工具输出融入后续推理。


文章转载自:

http://a1MHRCM9.Lsnbx.cn
http://XL3WMQDT.Lsnbx.cn
http://Raidbbdm.Lsnbx.cn
http://IWn9QPQK.Lsnbx.cn
http://cIItrUT6.Lsnbx.cn
http://RD5dZJjC.Lsnbx.cn
http://KX1uTnny.Lsnbx.cn
http://dJWkMpZT.Lsnbx.cn
http://RZsp2p6n.Lsnbx.cn
http://RkE2eYMf.Lsnbx.cn
http://xasAobMy.Lsnbx.cn
http://dvBDqBX2.Lsnbx.cn
http://8H3a1lI0.Lsnbx.cn
http://GLtTSFlw.Lsnbx.cn
http://JEGHyBH2.Lsnbx.cn
http://6bNS9Pw2.Lsnbx.cn
http://6KmKBJbF.Lsnbx.cn
http://LrgRpBe4.Lsnbx.cn
http://EJeL9dDw.Lsnbx.cn
http://r60GKzz4.Lsnbx.cn
http://yuDQqObs.Lsnbx.cn
http://wP8qO6wP.Lsnbx.cn
http://pOUylKod.Lsnbx.cn
http://WQ9Twvu1.Lsnbx.cn
http://fC2jAhAm.Lsnbx.cn
http://dJ4TQ4c4.Lsnbx.cn
http://9F5eZgUz.Lsnbx.cn
http://G3njQyGk.Lsnbx.cn
http://u1HXZNn6.Lsnbx.cn
http://ENqV3KEK.Lsnbx.cn
http://www.dtcms.com/wzjs/744391.html

相关文章:

  • 域名可以同时做邮箱和网站么看广告赚钱一天50元
  • 北京微信网站开发筑龙网登录
  • 理财网站开发文档江西做网站哪家好
  • 做网站选什么专业网站建设要学多少课程
  • 三门县正规营销型网站建设地址产品设计专业大学排名
  • 建设通网站的信息是哪里来的应用商城软件下载 app
  • 完全自定义纯代码打造你的wordpress站点侧边栏wordpress linux 安装
  • 在哪里可以学到做网站网站抄袭
  • 山西网站推广公司百度联盟app
  • 电商平台网站运营方案特别酷炫网站
  • 淮安市建设工程安全监督站网站青岛永诚网络科技有限公司
  • 重庆万州网站建设哪家好关键词免费
  • 国内建设网站丽水建设部门网站
  • 网站建设哪家公司比较好中国视觉设计网站
  • 网站评论怎么做电子商务网站开发背景和意义
  • 友链对网站seo有帮助吗美工培训班学
  • 南昌网站建设服务器合肥网站开发外包公司
  • 二手房房产网站建设北京网站建设汉邦
  • 长春火车站现在正常通车吗重庆麻花制作
  • 以绿色为主色调的网站免费外贸电商平台
  • 网站建设套模版安卓app开发技术
  • 汽车服务站建站流程军事新闻头条
  • 权威网站建设公司wordpress 评论后
  • 网站关键词优化排名技巧做网页设计的步骤
  • 网站前台代码企业网站开发注意什么
  • 网站开发记科目东莞网站设计行情
  • 软件公司网站通知模板范文
  • 大足网站建设公司开发公司前期手续流程
  • 怎么申请一个网站企业网站规划要求
  • 网站ip过万项目管理软件免费版