当前位置: 首页 > news >正文

书生浦语实战营第六期 L1-G3000

LMDeploy 部署

1.配置开发机
  • 镜像为 Cuda12.2-conda
  • GPU 为 30%A100
2.配置环境
conda create -n lmdeploy python=3.10 -y
conda activate lmdeploy

pip install "lmdeploy==0.9.2.post1" "transformers==4.55.2"

3.运行LMdeploy
lmdeploy serve api_server /root/share/new_models/Intern-S1-mini \--reasoning-parser intern-s1 \--tool-call-parser intern-s1 \--cache-max-entry-count 0.1 \--max-batch-size 8 \--backend turbomind \--session-len 2048

参数解析:

--tool-call-parser intern-s1

  • 作用: 指定工具调用(Function Calling)的解析器。

--cache-max-entry-count 0.1

  • 作用: 设置 KV 缓存所能占用的 GPU 显存比例。

--max-batch-size 8

  • 作用: 设置动态批处理的最大批次大小。

--backend turbomind

  • 作用: 指定推理后端引擎。

--session-len 2048

  • 作用: 设置模型能处理的最大会话长度(以 token 为单位)。

http://www.dtcms.com/a/449281.html

相关文章:

  • 前端IM应用开发中的难点解析与总结
  • Web 服务器 UserDir(~username)功能解析:从原理到安全实践
  • 25新三年级上册数学混合运算应用题八大专项+三年级上数学混合运算练习/八大考点(复合问题/倍数问题)+完整电子版可下载打印
  • Linux基础IO(下):文件重定向和缓冲区
  • Flink 高级配置发行版剖析、Scala 版本、Table 依赖与 Hadoop 集成实战
  • 半成品公司 网站专业公司网站建设
  • 【数据结构】二叉搜索树 C++ 简单实现:增删查改全攻略
  • 深度学习(十七):全批量梯度下降 (BGD)、随机梯度下降 (SGD) 和小批量梯度下降 (MBGD)
  • 实验十九 GaussDB三权分立实验
  • C++微基础备战蓝桥杯string篇10.5
  • 基于脚手架微服务的视频点播系统-脚手架开发部分-brpc中间件介绍与使用及二次封装
  • 网站建设需求登记表 免费下载软件开发公司企业简介
  • 北京城乡建设网站网站建设都是用什么软件
  • C++分布式语音识别服务实践
  • 轻松理解智能体设计模式(1/6):提示链(Prompt Chaining)
  • ARM TrustZone技术如何守护你的隐私
  • 北京恒伟网站建设wordpress 新页面打开空白
  • 从 0 到 1 搭建 Python 语言 Web UI自动化测试学习系列 8--基础知识 4--常用函数 2
  • 在 Python 项目中构建可靠的 CI/CD 流水线:从设计到实战(面向开发与运维的实用指南)
  • Linux基本指令(中)
  • 郑州服装网站建设公司php做电商网站安全性如何
  • 响应式网站 翻译网站关键词排名如何提升
  • python爬虫(二) ---- JS动态渲染数据抓取
  • 国庆回来的css
  • 廊坊做网站的电话公司网站外包
  • 八股文:计算机网络-20250925
  • MySql速成笔记5(多表关系)
  • 如何设计和建立一个公司的网站佛山网站优化有
  • 开源 C++ QT QML 开发(六)自定义控件--波形图
  • excel-mcp-server 安装