当前位置: 首页 > news >正文

sglang使用笔记

目录

1. sglang修改docker中的源代码

2. 参数解读

1. sglang修改docker中的源代码

长度过长会报max_req_input_len超过  

长度过长想要自动截取长度,但是原始的代码有bug,加上"--allow-auto-truncate"最终输出只有6个token,需要自己修改,修改流程为

sglang不能自己截断的bug修改,
1. 直接使用docker-compose启动镜像获得一个container_id,然后使用
2 . docker exec -it container_id bash
3. 直接修改docker里面的源代码
4. 重新启动container_id,使代码生效
docker restart container_id


设置"--context-length", "50000"
如果一个170000的就取前面30000加上后面300个,取后面300个是为了可能的结束符或其他符号

─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
http://www.dtcms.com/a/390366.html

相关文章:

  • 本地大模型编程实战(36)使用知识图谱增强RAG(2)生成知识图谱
  • clip——手写数字识别
  • commons-numbers
  • MySqL-day4_01(内置函数、存储过程、视图)
  • 用html5写一个手机ui
  • 2.canvas学习
  • 【系统架构设计(34)】计算机网络架构与技术基础
  • 计网1.2 计算机网络体系结构与参考模型
  • ML-Watermelonbook
  • E/E架构新课题的解决方案
  • 【CVPR 2025】用于密集图像预测的频率动态卷积
  • 整体设计 语言拼凑/逻辑拆解/词典缝合 之 1 表达词项的散列/序列/行列 (豆包助手)
  • FPGA学习篇——Verilog学习之半加器的实现
  • Python快速入门专业版(三十五):函数实战2:文件内容统计工具(统计行数/单词数/字符数)
  • CSS的文本样式二【文本布局】
  • redis配置与优化
  • STM32 单片机 - 中断
  • 【网络工程师】ACL基础实验
  • 小实验--LCD1602显示字符和字符串
  • Java 的双亲委派模型(Parent Delegation Model)
  • ​​[硬件电路-249]:LDO(低压差线性稳压器)专用于线性电源,其核心设计逻辑与线性电源高度契合,而与开关电源的工作原理存在本质冲突。
  • conda命令行指令大全
  • TCP三次握手与四次挥手
  • Python读取Excel中指定列的所有单元格内容
  • 【DMA】DMA入门:理解DMA与CPU的并行
  • Redis数据库(一)—— 初步理解Redis:从基础配置到持久化机制
  • Salesforce中的事件驱动架构:构建灵活可扩展的企业应用
  • OpenCV实现消除功能
  • Qt QValueAxis详解
  • deepseek大模型部署