当前位置: 首页 > news >正文

Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集,然后从这个词集中随机选择一个词作为输出。
例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积:模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到)。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止,此时所包含的词就构成了用于采样的候选词集
  • 随机采样:从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。

相关文章:

  • Redis--基础知识点--27--redis缓存分类树
  • 【AI论文】用于评估和改进大型语言模型中指令跟踪的多维约束框架
  • K8S Gateway API 快速开始、胎教级教程
  • AD 区域规则(Room规则)的设置
  • Mac 环境下 JDK 版本切换全指南
  • C#中的typeof操作符与Type类型:揭秘.NET反射的基础
  • React和Vue在前端开发中, 通常选择哪一个
  • 全面指南:Xinference大模型推理框架的部署与使用
  • 6大核心记忆方法
  • datax 加密
  • Qt 安装 QtMqtt 模块
  • vue3.0的name属性插件——vite-plugin-vue-setup-extend
  • 4寸工业三防手持机PDA,助力仓储高效管理
  • Elasticsearch相关面试题
  • RHCSA 考试操作手册(基于红帽企业 Linux 8/9 版本)​
  • fpga系列 HDL : Microchip FPGA开发软件 Libero Soc 安装 license申请
  • 对心理幸福感含义的探索 | 幸福就是一切吗?
  • Android开发-使用内容组件获取通讯信息
  • 【MySQL】第四弹——表的CRUD进阶(二)数据库设计
  • 《Python星球日记》 第78天:CV 基础与图像处理
  • 新闻1+1丨城市,如何对青年更友好?
  • 讲武谈兵|视距外的狙杀:从印巴空战谈谈超视距空战
  • 张涌任西安市委常委,已卸任西安市副市长职务
  • 七旬男子驾“老头乐”酒驾被查,曾有两次酒驾两次肇事记录
  • 广东早熟荔枝“抢滩”上海,向长三角消费者喊话:包甜,管够
  • 京东一季度净利增长五成,营收增速创近三年新高,称外卖业务取得显著进展