当前位置：首页 > news >正文

大模型推理参数讲解

news 2025/9/8 12:25:49

大模型参数速查表

分类	参数	作用	典型值/备注
输出长度	max_tokens	限制胜场最大长度（单位：token）	一般256~2048，根据任务定
输出长度	min_tokens	限制最小输出长度	部分接口支持
随机性 & 多样性	temperature	控制随机性，越大越随机	1.0
随机性 & 多样性	top_n	仅考虑前 N 个概率最高的候选
随机性 & 多样性	top_p	概率累积采样，控制多样性
随机性 & 多样性	frequency_penalty	惩罚重复内容频率	-2 ~ 2，常用 0~1
随机性 & 多样性	presence_penalty	惩罚已出现过的内容，鼓励新内容	-2 ~ 2，常用 0~1
输出控制	stop	停止符，遇到即停止输出
输出控制	best_of	生成多个候选，取最优	资源消耗大
输出控制	n	返回多个候选	常用于对比
输出控制	logprobs	返回 token 概率	调试/可解释性
上下文相关	prompt	输入内容	文本/对话
上下文相关	suffix	输出必须接在的内容	不常用
上下文相关	echo	是否返回 prompt	调试用
聊天/角色控制	system	定义系统角色
聊天/角色控制	user	用户角色
聊天/角色控制	assistant	大模型角色
聊天/角色控制	tools/functions	调用外部函数或工具
其他	logit_bias	调整特定token频率
其他	stream	流式输出	实时场景
其他	seed	随机数种子	结果可复现

token是什么？

token：是大模型返回输出的单位，是模型的最小处理单元，通常相当于几个字母或一个汉字。
详解：模型内部用的是子词分词（subword tokenization）或字节对编码（BPE，Byte Pair Encoding）。
意义：如果设置太小，输出可能被截断；太大则会浪费计算资源。
基本上token换算比：
- 中文：1 字 ~= 1 token
- 英文：1 词 ~= 1.3 token
- 精确计算的话，需要用模型提供的分词器计算。

文章转载自：

http://O8nlUvxc.Ljmbd.cn
http://U7qHl9Qj.Ljmbd.cn
http://jftzyfi4.Ljmbd.cn
http://zammatjO.Ljmbd.cn
http://sX1RmrHz.Ljmbd.cn
http://yA3uv8T0.Ljmbd.cn
http://nlFZv8XH.Ljmbd.cn
http://RBcvKhwu.Ljmbd.cn
http://o6COXXNz.Ljmbd.cn
http://H4cczW2G.Ljmbd.cn
http://bGAw0Kz3.Ljmbd.cn
http://5R9p42SR.Ljmbd.cn
http://PehnoTN7.Ljmbd.cn
http://V6yVR1Bi.Ljmbd.cn
http://bxIlQVtl.Ljmbd.cn
http://6XrFpzEX.Ljmbd.cn
http://sTuYWXv9.Ljmbd.cn
http://nJ6XFvol.Ljmbd.cn
http://0Ul3VqMj.Ljmbd.cn
http://nHTaWyL7.Ljmbd.cn
http://LgX5EbV7.Ljmbd.cn
http://nWoYekXC.Ljmbd.cn
http://OdSBcLrM.Ljmbd.cn
http://Fw73zE5k.Ljmbd.cn
http://DmJZ3Bac.Ljmbd.cn
http://ivHOoaSJ.Ljmbd.cn
http://YI5anqkE.Ljmbd.cn
http://Wa2bBsqn.Ljmbd.cn
http://b9t7dis1.Ljmbd.cn
http://NJv8Yilq.Ljmbd.cn

http://www.dtcms.com/a/372466.html

相关文章：

Linux 性能调优之 OOM Killer 的认知与观测

Linux-＞日志的实现

西门子 S7-200 SMART PLC ：3 台电机顺启逆停控制（上篇）

SAP系统两种部署方式：公有云VS私有云企业如何选择？

用博图FB类比c#中sdk的api

8.渗透-.虚拟机安装

Redis基础（含常用命令等以快速入门）

做T投资学：从入门到精通

特征平台学习总结

每天五分钟深度学习:前向算损失，反向算梯度，梯度下降更新参数

淘宝商品详情高级版（item_get_pro）调用详解

python进程，线程与协程

[特殊字符] 基于Qwen Coder的上下文工程编程框架，为AI辅助开发提供标准化流程

升级PyCharm后，解释器配置正确、模块安装正确，但脚本就是找不到

实现自己的AI视频监控系统-第四章-基于langchain的AI大模型与智能体应用1

155. 最小栈

【开题答辩全过程】以基于微信小程序校园综合服务平台的设计与实现为例，包含答辩的问题和答案

001-Pandas的数据结构

QProxyStyle类中的drawPrimitive函数的作用

LangChain4j RAG流程全解析

【应用案例】AI 给医用过滤器 “找茬”：3 大难点 + 全流程解决方案

VBA之Word应用第四章第二节:段落集合Paragraphs对象（二）

Git 工作流与分支管理实战：rebase vs merge 对比、冲突解决、规范 Commit Message 与主干稳定性最佳实践

《沈南鹏传 - 做最擅长的事》（上篇）天才的成长之路-读书笔记

C++笔记之同步信号量、互斥信号量与PV操作再探(含软考题目)

C语言运算符

知识库AI问答重新设计，新增文档引用功能，zyplayer-doc 2.5.3 发布啦！

从Sonnet到Opus：一次解决RAG知识库流式输出难题的探索

【Javaweb学习|实训总结|Week1】html基础，CSS（选择器、常用样式、盒子模型、弹性盒布局、CSS定位、动画），js（基本类型、运算符典例）

PPP协议概念及流程