当前位置: 首页 > news >正文

vllm-openai多服务器集群部署AI模型

服务器配置是两台ubantu系统电脑,每台电脑安装两张4090-48G显存的显卡,共计192G显存。

服务器1
在这里插入图片描述
服务器2
在这里插入图片描述
准备工作:
1.两台电脑都已经安装了docker
2.两台电脑都已经安装了nvidia驱动

参考vllm官方资料
https://docs.vllm.ai/en/latest/serving/distributed_serving.html#
在这里插入图片描述
1.先下载.sh文件
https://github.com/vllm-project/vllm/blob/main/examples/online_serving/run_cluster.sh

在这里插入图片描述
做主从关联

相关文章:

  • MyBatis SqlSession 是如何创建的? 它与 SqlSessionFactory 有什么关系?
  • V2X验证
  • C#入门学习记录(三)C#中的隐式和显示转换
  • 通过MATLAB和Carsim进行联合仿真,利用强化学习实现自动驾驶人机控制权策略的详细步骤和示例代码
  • Lora 中 怎么 实现 矩阵压缩
  • 有线网络和WiFi无线网络的优先级设置
  • Springboot+Vue登录、注册功能(含验证码)(后端!)
  • react18 核心知识点杂记1
  • MySQL高频八股——事务过程中Undo log、Redo log、Binlog的写入顺序(涉及两阶段提交)
  • 最短路径--dijkstra
  • debian12运行sql server2022(docker)
  • 基于微信小程序的网上商城
  • 【扩散模型入门】Latent Diffusion
  • 问题链的拓扑学重构
  • 【Android】ListView控件在进入|退出小窗下的异常
  • 数据库事务
  • Android Fresco 框架缓存模块源码深度剖析(二)
  • 解决 Android Studio “waiting for all target devices to come online“ 卡住问题
  • Asp.net Core API 本地化
  • ACWing:178. 第K短路 (A*算法)
  • 家政阿姨如何炼成全国劳模?做饭、收纳、养老、外语样样都会
  • 当农民跨进流动的世界|劳动者的书信①
  • 美商界报告:全美超86万岗位依赖对华出口,关税将重创美国出口商
  • 五部门:开展新就业形态劳动者劳动权益保障水平提升专项行动
  • 徐徕任上海浦东新区副区长,此前已任区委常委
  • 马上评丨准入壁垒越少,市场活力越足