当前位置：首页 > news >正文

书生浦语实战营第六期 L1-G3000

news 2025/10/7 5:34:32

LMDeploy 部署

1.配置开发机

镜像为 Cuda12.2-conda
GPU 为 30%A100

2.配置环境

conda create -n lmdeploy python=3.10 -y
conda activate lmdeploy

pip install "lmdeploy==0.9.2.post1" "transformers==4.55.2"

3.运行LMdeploy

lmdeploy serve api_server /root/share/new_models/Intern-S1-mini \--reasoning-parser intern-s1 \--tool-call-parser intern-s1 \--cache-max-entry-count 0.1 \--max-batch-size 8 \--backend turbomind \--session-len 2048

参数解析：

--tool-call-parser intern-s1

作用: 指定工具调用（Function Calling）的解析器。

--cache-max-entry-count 0.1

作用: 设置 KV 缓存所能占用的 GPU 显存比例。

--max-batch-size 8

作用: 设置动态批处理的最大批次大小。

--backend turbomind

作用: 指定推理后端引擎。

--session-len 2048

作用: 设置模型能处理的最大会话长度（以 token 为单位）。

查看全文

http://www.dtcms.com/a/449281.html

前端IM应用开发中的难点解析与总结

Web 服务器 UserDir（~username）功能解析：从原理到安全实践

25新三年级上册数学混合运算应用题八大专项+三年级上数学混合运算练习/八大考点（复合问题/倍数问题）+完整电子版可下载打印

Linux基础IO（下）：文件重定向和缓冲区

Flink 高级配置发行版剖析、Scala 版本、Table 依赖与 Hadoop 集成实战

半成品公司网站专业公司网站建设

【数据结构】二叉搜索树 C++ 简单实现：增删查改全攻略

深度学习（十七）：全批量梯度下降 (BGD)、随机梯度下降 (SGD) 和小批量梯度下降 (MBGD)

实验十九 GaussDB三权分立实验

C++微基础备战蓝桥杯string篇10.5

基于脚手架微服务的视频点播系统-脚手架开发部分-brpc中间件介绍与使用及二次封装

网站建设需求登记表免费下载软件开发公司企业简介

北京城乡建设网站网站建设都是用什么软件

C++分布式语音识别服务实践

轻松理解智能体设计模式(1/6)：提示链（Prompt Chaining）

ARM TrustZone技术如何守护你的隐私

北京恒伟网站建设wordpress 新页面打开空白

从 0 到 1 搭建 Python 语言 Web UI自动化测试学习系列 8--基础知识 4--常用函数 2

在 Python 项目中构建可靠的 CI/CD 流水线：从设计到实战（面向开发与运维的实用指南）

Linux基本指令（中）

郑州服装网站建设公司php做电商网站安全性如何

响应式网站翻译网站关键词排名如何提升

python爬虫(二) ---- JS动态渲染数据抓取

国庆回来的css

廊坊做网站的电话公司网站外包

八股文：计算机网络-20250925

MySql速成笔记5(多表关系）

如何设计和建立一个公司的网站佛山网站优化有

开源 C++ QT QML 开发（六）自定义控件--波形图

excel-mcp-server 安装

LMDeploy 部署

1.配置开发机

2.配置环境

3.运行LMdeploy

相关文章：