当前位置: 首页 > news >正文

【开发日记】LLM开发中的一些参数设置

MaxTokens 和 MaxContexts设置问题

场景输入 tokens 估算推荐 max_new_tokens原因
🔹 简单问答 / 聊天~512 tokens8192输入少,可留足输出空间,适合生成长回答
🔹 RAG(检索增强)~16,000 tokens(长文档)4096 ~ 8192输入占大头,输出需精简(如摘要)
🔹 代码生成~4096 tokens(上下文代码)8192生成函数或模块可能较长
🔹 摘要任务~30,000 tokens(整篇论文)512 ~ 1024输入几乎占满,只能生成短摘要
🔹 对话历史较多~10,000 tokens(多轮对话)4096平衡输入与输出

Top-k 和 SimilarityThreshold

Top-K: 控制文本生成过程中的解码多样性
  • 推荐取值设置
    • 小(10~20), 输出更确定、保守,可能重复。
    • 中等(40~50),平衡创造性和稳定性,通用生成任务
    • 大(100+~), 更多样、有创意,但可能不连贯。适用于创作、故事生成。
SimilarityThreshold: 控制向量检索(RAG)中的语义相关性过滤
  • 基于RAG,similarityThreshold是一个用于过滤检索结果的最小语义相似得分,只有相似度高于该阈值的文档片段才会被送入LLM
  • 常见相似指标
    • 余弦相似度:[-1, 1], 通常大于0.6认为相关
    • 点积相似度:未归一化,依赖向量长度
  • 余弦相似度推荐值: 阈值大于0.9可能导致无结果返回;太低则会引入噪声,影响生成质量。
    • <0.4, 通常视为不相关, 不推荐
    • 0.4 < x < 0.6, 宽松匹配,可能包含噪声。多义词、模糊查询
    • 0.6 < x < 0.8, 平衡相关性与召回率, 通用知识库、企业FAQ
    • x > 0.8, 专业问答、法律、医疗

segmentMaxTokens

segmentMaxTokens是一个常见于文本分开(Text chunking)或文档分割(Document Segmentation)阶段的参数。用于预处理阶段控制每个文本片段的最大长度

  • 定义: segmentMaxTokens,指在将长文本(如文档、网页、书籍)切分为多个片段(segments/chunks)时,每个片段最多包含的Token数量
  • 为什么需要segmentMaxTokens
    • LLM和嵌入模型(Embedding Model)都有上下文限制。Qwen3, maxTokens: 32,768 tokens, 大多数embedding模型,仅支持512~8196tokens。
    • 实际文档(如PDF报告、维基百科文章等)可能长达数万甚至数十万tokens。因此必须切分为小段。以便”能被嵌入模型编码,用于向量化和检索;在RAG中作为上下文输入给LLM; 提高检索精度“
  • 推荐取值
    • 通用问答/RAG, 512~1024, 平衡语义完整性与检索精度
    • 代码检索, 256~512, 函数/类级别粒度更合适
    • 长文档摘要, 2048~4096, 保留更多上下文结构
    • 多跳推理, 1024 ~ 2048,需要跨句逻辑关联
    • 轻量设备推理, 256 ~ 512,节省内存和计算资源。
http://www.dtcms.com/a/428595.html

相关文章:

  • 莆田网站建设平台推广联盟
  • 双抗 ADC 设计的核心密码:从抗体机制与结构看 “精准杀伤” 的底层逻辑
  • 网络销售网站设置购物网站的建设时间
  • 山东城市建设厅网站龙岩论坛
  • 阿里巴巴网站图片如何做白长沙网站建站公司
  • JAVA学习笔记——9道综合练习习题+二维数组
  • 微信编辑器做网站长沙网站开发公司
  • 网站备案信息代码wordpress高亮代码转义
  • 企业响应式网站建设报价网站如何做浏览量
  • 个体工商户可以申请网站建设吗长沙市师德师风建设网站
  • 青海网站建设设计江苏省建筑工程集团有限公司
  • 广东建设行业招聘 什么网站google广告联盟网站
  • dw做网站一般是多大的尺寸医院网站icp备案吗
  • 郑州 网站制作网站运营的案例
  • 学校网站代码模板网站建设平台安全问题有哪些方面
  • ubuntu开启NFS网络文件共享服务,并使用windows访问及排错过程
  • WinForm仪表盘
  • 做网站找酷万体育器材网站模板
  • 如何免费做公司网站wordpress模板带后台
  • Linux日志查看常用命令
  • 泰安整站优化wordpress头部空白
  • 考研408之栈与队列学习
  • 软考-系统架构设计师 软件架构概念详细讲解
  • 都匀网站建设住建部注册中心官网
  • Problem: lab-week4- exercise02 Quick sort
  • 营销型网站策划怎么做中国公司查询网站
  • 通信领域常见基本概念与术语
  • Trae CN配置Maven环境
  • 门户网站改版计算机网页设计就业方向
  • 无锡网站设计哪家公司好长春火车站照片