当前位置: 首页 > news >正文

【GPT入门】第40课 vllm与ollama特性对比,与模型部署

【GPT入门】第40课 vllm与ollama特性对比,与模型部署

  • 1.两种部署
  • 1.1 vllm与ollama特性对比
  • 2. vllm部署
    • 2.1 服务器准备
    • 2.1 下载模型
    • 2.2 提供模型服务

1.两种部署

1.1 vllm与ollama特性对比

在这里插入图片描述
在这里插入图片描述

2. vllm部署

2.1 服务器准备

在autodl 等大模型服务器提供商,采购一个
在这里插入图片描述

2.1 下载模型

pip install modelscope
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

2.2 提供模型服务

root@autodl-container-9f7a4caa9b-14e615df:~# python -m venv vllm
root@autodl-container-9f7a4caa9b-14e615df:~# source vllm/bin/activate
(vllm) root@autodl-container-9f7a4caa9b-14e615df:~# pip install vllmvllm serve  /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

在这里插入图片描述
在这里插入图片描述

http://www.dtcms.com/a/225022.html

相关文章:

  • Leetcode 3568. Minimum Moves to Clean the Classroom
  • 【云安全】以Aliyun为例聊云厂商服务常见利用手段
  • Java大厂后端技术栈故障排查实战:Spring Boot、Redis、Kafka、JVM典型问题与解决方案
  • Vue3.5 企业级管理系统实战(二十一):菜单权限
  • flask pyinstaller打包exe,出现module not found问题
  • 用mediamtx搭建简易rtmp,rtsp视频服务器
  • FFmpeg学习笔记
  • SDL_CreateRendererWithProperties报错Parameter ‘window‘ is invalid
  • Linux 第三阶段课程:数据库基础与 SQL 应用
  • Domain Adaptation in Vision-Language Models (2023–2025): A Comprehensive Review
  • NLP学习路线图(十四):词袋模型(Bag of Words)
  • gin 框架
  • 【Tauri2】049——upload
  • LangChain-结合智谱AI大模型实现自定义tools应用实例
  • 【Netty系列】自定义协议
  • CM3内核寄存器
  • latex figure Missing number, treated as zero. <to be read again>
  • Android的uid~package~pid的关系
  • NodeJS全栈开发面试题讲解——P9性能优化(Node.js 高级)
  • 经典面试题:一文了解常见的缓存问题
  • Spark on Hive表结构变更
  • 性能优化 - 案例篇:缓存
  • NodeJS全栈开发面试题讲解——P10微服务架构(Node.js + 多服务协作)
  • 聊一聊接口测试中缓存处理策略
  • 多模态大语言模型arxiv论文略读(102)
  • 量子语言模型——where to go
  • 快速掌握 GO 之 RabbitMQ 结合 gin+gorm 案例
  • SQL进阶之旅 Day 10:执行计划解读与优化
  • Python应用for循环临时变量作用域
  • 基于Android的跳蚤市场_springboot+vue