当前位置: 首页 > news >正文

大模型推理参数讲解

大模型参数速查表

分类参数作用典型值/备注
输出长度max_tokens限制胜场最大长度(单位:token)一般256~2048,根据任务定
输出长度min_tokens限制最小输出长度部分接口支持
随机性 & 多样性temperature控制随机性,越大越随机1.0
随机性 & 多样性top_n仅考虑前 N 个概率最高的候选
随机性 & 多样性top_p概率累积采样,控制多样性
随机性 & 多样性frequency_penalty惩罚重复内容频率-2 ~ 2,常用 0~1
随机性 & 多样性presence_penalty惩罚已出现过的内容,鼓励新内容-2 ~ 2,常用 0~1
输出控制stop停止符,遇到即停止输出
输出控制best_of生成多个候选,取最优资源消耗大
输出控制n返回多个候选常用于对比
输出控制logprobs返回 token 概率调试/可解释性
上下文相关prompt输入内容文本/对话
上下文相关suffix输出必须接在的内容不常用
上下文相关echo是否返回 prompt调试用
聊天/角色控制system定义系统角色
聊天/角色控制user用户角色
聊天/角色控制assistant大模型角色
聊天/角色控制tools/functions调用外部函数或工具
其他logit_bias调整特定token频率

其他

stream流式输出实时场景
其他seed随机数种子结果可复现

token是什么?

  • token:是大模型返回输出的单位,是模型的最小处理单元,通常相当于几个字母或一个汉字。
  • 详解:模型内部用的是子词分词(subword tokenization)字节对编码(BPE,Byte Pair Encoding)
  • 意义:如果设置太小,输出可能被截断;太大则会浪费计算资源。
  • 基本上token换算比:
    • 中文:1 字 ~= 1 token
    • 英文:1 词 ~= 1.3 token
    • 精确计算的话,需要用模型提供的分词器计算。


文章转载自:

http://O8nlUvxc.Ljmbd.cn
http://U7qHl9Qj.Ljmbd.cn
http://jftzyfi4.Ljmbd.cn
http://zammatjO.Ljmbd.cn
http://sX1RmrHz.Ljmbd.cn
http://yA3uv8T0.Ljmbd.cn
http://nlFZv8XH.Ljmbd.cn
http://RBcvKhwu.Ljmbd.cn
http://o6COXXNz.Ljmbd.cn
http://H4cczW2G.Ljmbd.cn
http://bGAw0Kz3.Ljmbd.cn
http://5R9p42SR.Ljmbd.cn
http://PehnoTN7.Ljmbd.cn
http://V6yVR1Bi.Ljmbd.cn
http://bxIlQVtl.Ljmbd.cn
http://6XrFpzEX.Ljmbd.cn
http://sTuYWXv9.Ljmbd.cn
http://nJ6XFvol.Ljmbd.cn
http://0Ul3VqMj.Ljmbd.cn
http://nHTaWyL7.Ljmbd.cn
http://LgX5EbV7.Ljmbd.cn
http://nWoYekXC.Ljmbd.cn
http://OdSBcLrM.Ljmbd.cn
http://Fw73zE5k.Ljmbd.cn
http://DmJZ3Bac.Ljmbd.cn
http://ivHOoaSJ.Ljmbd.cn
http://YI5anqkE.Ljmbd.cn
http://Wa2bBsqn.Ljmbd.cn
http://b9t7dis1.Ljmbd.cn
http://NJv8Yilq.Ljmbd.cn
http://www.dtcms.com/a/372466.html

相关文章:

  • Linux 性能调优之 OOM Killer 的认知与观测
  • Linux->日志的实现
  • 西门子 S7-200 SMART PLC :3 台电机顺启逆停控制(上篇)
  • SAP系统两种部署方式:公有云VS私有云 企业如何选择?
  • 用博图FB类比c#中sdk的api
  • 8.渗透-.虚拟机安装
  • Redis基础(含常用命令等以快速入门)
  • 做T投资学:从入门到精通
  • 特征平台学习总结
  • 每天五分钟深度学习:前向算损失,反向算梯度,梯度下降更新参数
  • 淘宝商品详情高级版(item_get_pro)调用详解
  • python进程,线程与协程
  • [特殊字符] 基于Qwen Coder的上下文工程编程框架,为AI辅助开发提供标准化流程
  • 升级PyCharm后,解释器配置正确、模块安装正确,但脚本就是找不到
  • 实现自己的AI视频监控系统-第四章-基于langchain的AI大模型与智能体应用1
  • 155. 最小栈
  • 【开题答辩全过程】以 基于微信小程序校园综合服务平台的设计与实现为例,包含答辩的问题和答案
  • 001-Pandas的数据结构
  • QProxyStyle类中的drawPrimitive函数的作用
  • LangChain4j RAG流程全解析
  • 【应用案例】AI 给医用过滤器 “找茬”:3 大难点 + 全流程解决方案
  • VBA之Word应用第四章第二节:段落集合Paragraphs对象(二)
  • Git 工作流与分支管理实战:rebase vs merge 对比、冲突解决、规范 Commit Message 与主干稳定性最佳实践
  • 《沈南鹏传 - 做最擅长的事》(上篇)天才的成长之路-读书笔记
  • C++笔记之同步信号量、互斥信号量与PV操作再探(含软考题目)
  • C语言运算符
  • 知识库AI问答重新设计,新增文档引用功能,zyplayer-doc 2.5.3 发布啦!
  • 从Sonnet到Opus:一次解决RAG知识库流式输出难题的探索
  • 【Javaweb学习|实训总结|Week1】html基础,CSS(选择器、常用样式、盒子模型、弹性盒布局、CSS定位、动画),js(基本类型、运算符典例)
  • PPP协议概念及流程