当前位置: 首页 > wzjs >正文

好动词做的网站能行吗自媒体视频发布平台

好动词做的网站能行吗,自媒体视频发布平台,从事网站建设,最专业的网站建设组织论文标题 Accelerating Large Language Model Reasoning via Speculative Search 论文地址 https://www.arxiv.org/pdf/2505.02865 作者背景 中科大,华为诺亚方舟实验室,天津大学 ICML 2025接收 动机 之前介绍过多篇投机解码(推测式解…

论文标题

Accelerating Large Language Model Reasoning via Speculative Search

论文地址

https://www.arxiv.org/pdf/2505.02865

作者背景

中科大,华为诺亚方舟实验室,天津大学
ICML 2025接收

动机

之前介绍过多篇投机解码(推测式解码)的相关工作

大模型推理加速:EAGLE-3介绍
大模型推理加速:自适应早退与动态投机长度
大模型推理加速: 使用多个异构的小模型加快投机解码

而本文试图将“小模型草稿-大模型验证”的思路应用到长思考推理中

相较于CoT,树形搜索(如BeamSearch、MCTS)可以更加充分地考虑多种可能的情况,从而提供更加深思熟虑后的回答,但它们需要大量的中间推理步骤,时间开销、token消耗极大

在这里插入图片描述

实际上在复杂问题的多步推理中,不同步骤的难度差异明显:部分步骤相对简单,小模型也能给出高质量结果;而另一些步骤复杂,需要强大的模型才能正确解决。

在这里插入图片描述

例如,计算“99²+99+1”包含99²(较难)和99+1(较易)两个子步骤

于是我们完全可以借助投机解码的思想,先使用小模型快速输出各种思路的草稿,然后再利用大模型并行地验证,从而降低时间与计算资源的消耗

面临挑战

原始的投机解码方法难以直接用于复杂推理,主要是由于以下两方面的局限性:

  • 它只是token级加速方案,无法同时探索多条推理路径,无法减少多分支推理的总体步骤数
  • 它只关注局部token的一致性,并不能确保全局逻辑正确。小模型可能提出在语义上看似合理但逻辑上错误的步骤,即使大模型概率上接受了这些token,最后推理结果可能偏离正确答案

本文方法

本文提出Speculative Search(投机搜索,or推测式搜索),让小模型和大模型在思路级(粗粒度)和token级(细粒度)两个层面协作,采用“起草-评估-拒绝-纠正”的推理生成步骤,在保证质量的前提下显著提升了推理速度

SpecSearch的核心思想是:由小模型快速起草多个中间推理步骤候选,利用验证模型评估筛选其质量,仅当小模型候选不达标时才调用大模型纠正,并动态调整策略以保持与大模型单独推理的质量一致

1.草稿阶段: 先由一个较小且快速的模型 Gq 根据当前已有的思路序列,批量快速生成N个下一步思路候选

2.评估阶段: 使用一个验证模型 Verifier 对每个候选思路进行质量评分(类似于过程奖励模型),预测该中间步骤的“有用性”或正确性分数。同时,根据大模型的历史表现设定一个动态阈值 β,如果候选评分高于β,则认为这个思路质量达标,可以接受;反之则拒绝

在这里插入图片描述

3.纠正阶段: 对于被筛掉的候选思路,SpecSearch采用大模型 Gp来生成该步骤的替代思路。为避免大模型逐字慢速输出,这里同时应用了投机解码来加速,即由小模型Gq 打草稿,大模型Gp 来验证,从而快速得到替代结果

4.动态更新阈值: 由于推理步骤的难度存在变化,SpecSearch会动态调整接受阈值 β。具体地,利用刚才那些由大模型产生的“纠正思路”的评分数据,采用统计方法(如指数移动平均)估计大模型在当前阶段的输出质量。比如随着推理深入,大模型的思路质量可能会下降,此时阈值也应下调

在这里插入图片描述

5.循环搜索: 以上过程在每个推理步骤重复进行。被接受和纠正的思路一起组成当前步骤可能的扩展节点,然后使用常规的搜索算法(如Beam Search或MCTS)决定下一步要扩展哪些节点,继续让小模型起草候选…如此迭代,直到找到完整的解答路径或达到终止条件

在这里插入图片描述

可见SpecSearch作为搜索树的节点扩展模块,能够无缝嵌入各种推理算法,并且保证了质量无损:每一步进入搜索树的思路,要么来自小模型且通过了质量门槛,要么干脆由大模型产生,因而不会比大模型原本输出的质量更差。如果阈值设置准确,最终的解答路径质量将与纯大模型搜索相当(论文对此进行了理论证明)

实验结果

作者主要在数学问题集MATH和小学数学词题集GSM8K上验证了Speculative Search的效果,主要结论如下:

在这里插入图片描述

可见此方法能在保证任务效果不下降的前提下,大幅提高推理速度

在这里插入图片描述

SpecSearch还具有良好的鲁棒性,在更换不同的搜索方法、评估模型时,均是在保持准确性的前提下大幅提高推理速度

在这里插入图片描述

除了结果的准确性,从推理过程的奖励变化可见,SpecSearch的推理过程明显更加准确合理

http://www.dtcms.com/wzjs/386361.html

相关文章:

  • html网站开发中国营销传播网官网
  • 哪个网站看电视剧最全还免费企业网络组建方案
  • 网站做不下去夜狼seo
  • 网站备案审核通过时间鹤壁搜索引擎优化
  • 广告网站开发超级外链发布工具
  • 宝塔本地wordpressseo诊断书
  • 网站支持qq登录怎么做官方网站怎么注册
  • 旅游网站做精准营销的百度贴吧怎么发广告
  • 微信小程序开发需要什么如何优化关键词的排名
  • 哪个cms做企业网站好steam交易链接怎么用
  • 帮做钓鱼网站会怎样网站维护的主要内容
  • 上海公司牌照南昌seo排名收费
  • wordpress网站建小程序周口seo推广
  • 大陆怎么做香港网站独立站seo是什么
  • 买域名后怎么做网站互联网广告平台有哪些
  • 高校门户网站系统青海seo技术培训
  • ui设计页面seo搜索引擎优化案例
  • 如何判断网站开发语言海口关键词优化报价
  • 做百度网站网络营销品牌案例
  • 做后期哪个网站素材好网站优化的意义
  • 网站搭建就来徐州百度网络非常好百度人气榜
  • 开源程序做网站重庆seo和网络推广
  • 优秀个人博客网站软件开发培训多少钱
  • 做公司网站需要什么资料广告投放运营主要做什么
  • 网站如何做电脑和手机线下宣传渠道和宣传方式
  • 网站地图 seo网络策划书范文
  • 教育推广廊坊百度关键词优化怎么做
  • 河东苏州网站建设外贸seo是什么意思
  • 专业做w7系统的网站石家庄今日头条新闻
  • 建筑人才信息网查询厦门seo服务