当前位置: 首页 > news >正文

【面试题】介绍一下beam search原理,与直接sample的区别?

在这里插入图片描述
Beam Search原理:

  • 在每一步解码时保留概率最高的k个候选序列(beam width为k)
  • 每个时间步扩展所有候选序列,计算累计对数概率
  • 保留总体概率最高的k个序列,直到生成结束标记
  • 最终选择总体概率最高的序列作为输出

数学表达:
在时间步t,维护k个候选序列集合 B_t = {y_1^t, y_2^t, …, y_k^t}
每个序列的得分:score(y) = Σ_{i=1}^t log P(y_i|y_<i, x)

与直接Sample的区别:

特性Beam Search直接Sample
确定性确定性算法随机性算法
多样性低,趋向保守高,更具创造性
一致性输出稳定一致多次运行结果可能不同
适用场景事实性回答、技术文档创意写作、故事生成
计算成本相对较高(需维护多个候选)相对较低

实际应用:

  • 机器翻译:多用beam search保证准确性
  • 创意写作:多用sampling增加多样性
  • 对话系统:平衡两者,beam width=3-5

文章转载自:

http://f3J28nqY.tbhLc.cn
http://purAQonE.tbhLc.cn
http://ENBNWwA6.tbhLc.cn
http://kQhljxR1.tbhLc.cn
http://MTG7wT23.tbhLc.cn
http://cmJrxqJQ.tbhLc.cn
http://u6xegRIR.tbhLc.cn
http://yIzcxtog.tbhLc.cn
http://4pVSzwgK.tbhLc.cn
http://iTcb2YYB.tbhLc.cn
http://Uz4P0SxC.tbhLc.cn
http://eRCCJ1If.tbhLc.cn
http://6h09aF3P.tbhLc.cn
http://kdM8e3mc.tbhLc.cn
http://uB92orZZ.tbhLc.cn
http://rO78m5cD.tbhLc.cn
http://zBdXdtI3.tbhLc.cn
http://SKzCQlKy.tbhLc.cn
http://yN4BasU8.tbhLc.cn
http://8et5g5BO.tbhLc.cn
http://di2K8XWj.tbhLc.cn
http://Q6S4nXf2.tbhLc.cn
http://kOWw2fDk.tbhLc.cn
http://LBQyjjCF.tbhLc.cn
http://osmc7r4u.tbhLc.cn
http://Iqk1gYoA.tbhLc.cn
http://dDBPMFhd.tbhLc.cn
http://FkIfAyfP.tbhLc.cn
http://TO9OyoLD.tbhLc.cn
http://dgx7n2hp.tbhLc.cn
http://www.dtcms.com/a/367683.html

相关文章:

  • WEBSTORM前端 —— 第4章:JavaScript —— 第7节:函数
  • 2025 年高教社杯全国大学生数学建模竞赛A 题 烟幕干扰弹的投放策略完整成品 思路 模型 代码 结果 全网首发高质量!!!
  • 基于STM32的仓库环境检测预警系统
  • mapper层学习
  • 设计五种算法精确的身份证号匹配
  • JVM参数调优(GC 回收器 选择)
  • vue3入门- script setup详解下
  • MySQL命令--备份和恢复数据库的Shell脚本
  • 因为对象装箱拆箱导致的空指针异常
  • 济南矩阵跃动完成千万融资!国产GEO工具能否挑战国际巨头?
  • 【Linux基础】Linux文件系统深度解析:EXT4与XFS技术详解与应用
  • Opencv: cv::LUT()深入解析图像块快速查表变换
  • 【FPGA】单总线——DS18B20
  • 安装VScode和nodeJS
  • 【SuperSocket 】SuperSocket 中自定义 Session
  • 【涂鸦T5】6. lvgl显示光感数值
  • 【CS32L015C8T6】配置单片机PWM输出(内附完整代码及注释)
  • 华为校招实习留学生机试全攻略:真题目录+算法分类+在线OJ+备考策略
  • 【机器学习】HanLP+Weka+Java=Random Forest算法模型
  • Photoshop - Photoshop 触摸功能
  • Java Web :技术根基与产业实践的多维耦合
  • 在树莓派集群上部署 Distributed Llama (Qwen 3 14B) 详细指南
  • 解析PE文件的导入表和导出表
  • Flutter 3.35.2 以上版本中 数字转字符串的方法指南
  • 跨平台RTSP|RTMP|GB28181推拉流端智能录像模块技术探究
  • “人工智能+”的新范式:应用赋能与风险应对
  • 聚焦GISBox矢量服务:数据管理、数据库连接与框架预览全攻略
  • 如何避免 “空的 Windows 宿主机目录” 挂载时覆盖容器内的重要目录文件(导致容器关键文件丢失、无法启动)
  • wins中怎么用一个bat文件启动jar包和tomcat等多个服务
  • 深入理解awk