当前位置：首页 > news >正文

【GPT入门】第40课 vllm与ollama特性对比，与模型部署

news 2025/7/20 20:43:27

【GPT入门】第40课 vllm与ollama特性对比，与模型部署

1.两种部署
1.1 vllm与ollama特性对比
2. vllm部署
- 2.1 服务器准备
- 2.1 下载模型
- 2.2 提供模型服务

1.两种部署

1.1 vllm与ollama特性对比

在这里插入图片描述

2. vllm部署

2.1 服务器准备

在autodl 等大模型服务器提供商，采购一个
在这里插入图片描述

2.1 下载模型

pip install modelscope
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

2.2 提供模型服务

root@autodl-container-9f7a4caa9b-14e615df:~# python -m venv vllm
root@autodl-container-9f7a4caa9b-14e615df:~# source vllm/bin/activate
(vllm) root@autodl-container-9f7a4caa9b-14e615df:~# pip install vllmvllm serve  /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

在这里插入图片描述

http://www.dtcms.com/a/225022.html

相关文章：

Leetcode 3568. Minimum Moves to Clean the Classroom

【云安全】以Aliyun为例聊云厂商服务常见利用手段

Java大厂后端技术栈故障排查实战：Spring Boot、Redis、Kafka、JVM典型问题与解决方案

Vue3.5 企业级管理系统实战（二十一）：菜单权限

flask pyinstaller打包exe,出现module not found问题

用mediamtx搭建简易rtmp，rtsp视频服务器

FFmpeg学习笔记

SDL_CreateRendererWithProperties报错Parameter ‘window‘ is invalid

Linux 第三阶段课程：数据库基础与 SQL 应用

Domain Adaptation in Vision-Language Models (2023–2025): A Comprehensive Review

NLP学习路线图（十四）：词袋模型（Bag of Words）

gin 框架

【Tauri2】049——upload

LangChain-结合智谱AI大模型实现自定义tools应用实例

【Netty系列】自定义协议

CM3内核寄存器

latex figure Missing number, treated as zero. ＜to be read again＞

Android的uid~package~pid的关系

NodeJS全栈开发面试题讲解——P9性能优化（Node.js 高级）

经典面试题：一文了解常见的缓存问题

Spark on Hive表结构变更

性能优化 - 案例篇：缓存

NodeJS全栈开发面试题讲解——P10微服务架构（Node.js + 多服务协作）

聊一聊接口测试中缓存处理策略

多模态大语言模型arxiv论文略读（102）

量子语言模型——where to go

快速掌握 GO 之 RabbitMQ 结合 gin+gorm 案例

SQL进阶之旅 Day 10：执行计划解读与优化

Python应用for循环临时变量作用域

基于Android的跳蚤市场_springboot+vue