当前位置: 首页 > news >正文

VLLM 调用有哪些超参数; clean_up_tokenization_spaces是什么

VLLM 调用有哪些超参数

主要添加的可选参数包括:

  1. 模型加载参数

    • low_cpu_mem_usage=True:减少模型加载时的CPU内存占用
    • load_in_4bit=True:使用4位量化(需要安装bitsandbytes库)
    • quantization_config:自定义量化配置
  2. 生成参数

    • temperature:控制生成文本的随机性(较低值更确定性,较高值更随机)
    • top_ptop_k:控制采样策略
    • num_beams:束搜索宽度(增加该值会提高生成质量但降低速度)
    • repetition_penalty:减少重复文本的生成
    • length_penalty:控制生成文本的长度偏好
  3. 其他参数

http://www.dtcms.com/a/270063.html

相关文章:

  • ubuntu24.04安装NFS网络文件系统/ARM开发板NFS挂载
  • 20250708-03-string结构及命令详解_笔记
  • CI/CD — DevOps概念之实现k8s持续交付持续集成(一)
  • NumPy-统计函数详解
  • UE5内置插件 AnimToTexture 简单入门
  • 一次编码,多端运行:HTML5多终端调用
  • Android 依赖注入框架详解
  • 2025年7月8日学习笔记——模式识别与机器学习绪论
  • bro code Interface
  • 社区云管家 - 智慧生活新方式 ——仙盟创梦IDE
  • 玩转Docker | 使用Docker部署HomeBox家庭库存管理工具
  • NestJS 系列教程(四):中间件、中断器与异常过滤器详解
  • JavaScript基础篇——第一章 JavaScript基础的认识
  • MySQL 【环境安装、基础认识】
  • OpenCV在Visual Studio 2022下的配置
  • 牛市来临之际,如何用期权抢占反弹先机?
  • Centos和麒麟系统如何每天晚上2点10分定时备份达梦数据库
  • VUE 带有搜索功能的穿梭框(简单demo)
  • 【DOCKER】-2 docker基础
  • 科技云报到:云智融合双buff,AI已开挂
  • 数据结构-顺序表-拿硬币
  • Effective Python 条款5 用辅助函数取代复杂的表达式
  • 数据结构:位图
  • 【保姆级目标检测教程】Ubuntu 20.04 部署 YOLOv13 全流程(附训练/推理代码)
  • Rust DevOps框架管理实例
  • 基于SpringBoot+Vue的非遗文化传承管理系统(websocket即时通讯、协同过滤算法、支付宝沙盒支付、可分享链接、功能量非常大)
  • 实时音视频通过UDP打洞实现P2P优先通信
  • C++--AVL树
  • 第一章、RNN(循环神经网络)
  • 怪物机制分析(有限状态机、编辑器可视化、巡逻机制)