当前位置: 首页 > news >正文

通义Qwen实战(2): vllm框架部署实战

文章目录

    • 1. 环境安装
      • 1.1 基础环境
      • 1.2 vllm-gptq库安装
    • 2. vllm 原理
      • 2.1 vllm介绍
      • 2.2 vllm 框架的使用
    • 3 vllm 部署实战
      • 3.1 离线推理
      • 3.2 chat 方法实现
        • 3.2.1 初始化函数
        • 3.2.2 chat方法实现
        • 3.2.3 效果展示
    • 4. 服务端部署
      • 4.1 效果演示
      • 4. 2 代码详解
      • 4.3 聊天可视化

1. 环境安装

1.1 基础环境

conda create -n vllm python=3.10 -y
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda
http://www.dtcms.com/a/94702.html

相关文章:

  • Yolo系列之Yolo v1概述及网络结构理解
  • C —— 指针和数组的面试题
  • Scala 之 正则
  • 安科瑞微电网能量管理控制箱,光伏发电的守护者
  • 【蓝桥杯】重点冲刺
  • 打破传统查询瓶颈:深入解析MySQL 8.0 LATERAL JOIN的实战价值
  • Oracle初识:登录方法、导入dmp文件
  • 【深度学习新浪潮】图像修复(Image Inpainting)技术综述:定义、进展与应用展望
  • 第十六届蓝桥杯模拟二(串口通信)
  • 文献笔记 - Analysis of Ground Effect for Small-Scale UAVs in Forward Flight
  • 设计秒杀系统(高并发的分布式系统)
  • 20250327解决在立创eda中铺了GND的铜之后仍显示部分地线未连接
  • Vue3.5 企业级管理系统实战(十):面包屑导航组件
  • FFmpeg学习:AVPacket结构体
  • 谷歌Chrome浏览器零日漏洞遭黑客大规模利用
  • Nginx 学习笔记
  • 华为eNSP-配置静态路由与静态路由备份
  • FALL靶机
  • 双目云台摄像头全方位监控方案
  • 网吧网络的边缘计算
  • CSS样式大全
  • 软考《信息系统运行管理员》- 5.3 信息系统数据资源备份
  • 17 python 文件管理
  • 聊一聊安卓WallpaperService壁纸窗口触摸事件接收原理-第一篇
  • POSIX 线程取消与资源清理完全指南
  • 青少年编程与数学 02-012 SQLite 数据库简介 04课题、数据库应用
  • uniapp自定义目录tree(支持多选、单选、父子联动、全选、取消、目录树过滤、异步懒加载节点、v-model)vue版本
  • 7.8 窗体间传递数据
  • Redis和三大消息队列
  • 判断字符串是否存在于 Pandas DataFrame