当前位置: 首页 > news >正文

通义Qwen实战(2): vllm框架部署实战

文章目录

    • 1. 环境安装
      • 1.1 基础环境
      • 1.2 vllm-gptq库安装
    • 2. vllm 原理
      • 2.1 vllm介绍
      • 2.2 vllm 框架的使用
    • 3 vllm 部署实战
      • 3.1 离线推理
      • 3.2 chat 方法实现
        • 3.2.1 初始化函数
        • 3.2.2 chat方法实现
        • 3.2.3 效果展示
    • 4. 服务端部署
      • 4.1 效果演示
      • 4. 2 代码详解
      • 4.3 聊天可视化

1. 环境安装

1.1 基础环境

conda create -n vllm python=3.10 -y
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda

相关文章:

  • Yolo系列之Yolo v1概述及网络结构理解
  • C —— 指针和数组的面试题
  • Scala 之 正则
  • 安科瑞微电网能量管理控制箱,光伏发电的守护者
  • 【蓝桥杯】重点冲刺
  • 打破传统查询瓶颈:深入解析MySQL 8.0 LATERAL JOIN的实战价值
  • Oracle初识:登录方法、导入dmp文件
  • 【深度学习新浪潮】图像修复(Image Inpainting)技术综述:定义、进展与应用展望
  • 第十六届蓝桥杯模拟二(串口通信)
  • 文献笔记 - Analysis of Ground Effect for Small-Scale UAVs in Forward Flight
  • 设计秒杀系统(高并发的分布式系统)
  • 20250327解决在立创eda中铺了GND的铜之后仍显示部分地线未连接
  • Vue3.5 企业级管理系统实战(十):面包屑导航组件
  • FFmpeg学习:AVPacket结构体
  • 谷歌Chrome浏览器零日漏洞遭黑客大规模利用
  • Nginx 学习笔记
  • 华为eNSP-配置静态路由与静态路由备份
  • FALL靶机
  • 双目云台摄像头全方位监控方案
  • 网吧网络的边缘计算
  • java 视频网站开发/域名备案查询系统
  • wap移动建站系统/百度竞价投放
  • 长沙网站seo诊断/百度非企渠道开户
  • 东莞市微网站官方网站/sem网络推广是什么
  • 网站建设火凤凰/百度推广是干什么的
  • 梧州做网站建设/数据分析培训