当前位置: 首页 > news >正文

triton backend 模式docker 部署 pytorch gpu模型 镜像选择

1.选取镜像类型

参考 官方tag 对应的镜像地址
https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver?version=25.09-trtllm-python-py3
在这里插入图片描述

nvcr.io/nvidia/tritonserver 镜像主要分为三类
pyt-python-py3
trtllm-python-py3
py3
看下图
在这里插入图片描述
可以看出 py3 < pyt < llm Py3
在这里插入图片描述

因为本次安装的是基于 pytorch pth模型,同时需要pytorch 进行数据处理成张量。所以选择 pyt-python-py3

2.确定镜像版本

查看 机器的cuda 和驱动版本
nvidia-smi
NVIDIA-SMI 545.23.08 Driver Version: 545.23.08 CUDA Version: 12.3

确定镜像的版本,否则镜像是不能支持对应的版本的。 nvidia的官网 不同版本对应的环境
https://docs.nvidia.com/deeplearning/triton-inference-server/release-notes/rel-23-11.html#rel-23-11

3.安装pytorch

虽然镜像说是提供了pytorch 但是依旧需要下载torch 包,可能是我选择的版本问题吧…

pip install torch==2.3.1 torchvision==0.18.1 --extra-index-url https://download.pytorch.org/whl/cu121   -i https://pypi.tuna.tsinghua.edu.cn/simple

安装工具包

pip install pandas numpy scikit-learn  -i https://pypi.tuna.tsinghua.edu.cn/simple

4.启动docker 和 triton

我是分开执行,各位可以直接一把启动哈
1.根据命令启动docker

docker run -it  \--gpus device=6 \-p 18000:8000 -p 18001:8001  -p 18002:8002\   -v /opt/triton_inference_serve/model_repository:/models \--name triton-pytorch-dsn \nvcr.io/nvidia/tritonserver:23.12-pyt-python-py3 \bash

–gpus device=6
选择gpu号

-p 18000:8000 -p 18001:8001 -p 18002:8002\
暴露接口

-v /opt/triton_inference_serve/model_repository:/models
挂载模型目录

在这里插入图片描述
2.启动triton

我使用了nohup,避免每次启动

nohup tritonserver \--model-repository=/models \--backend-directory=/opt/tritonserver/backends \--backend-config=python,execution_mode=enabled \--log-verbose=2 \--log-file=/models/dsn/logs/triton.log \> /models/dsn/logs/nohup.out 2>&1 &

–model-repository=/models
指定模型执行地址

–backend-directory=/opt/tritonserver/backends
指定后端启动的python 库

–log-verbose=2 >1 表示开启日志

–log-file=/models/dsn/logs/triton.log \
/models/dsn/logs/nohup.out 2>&1 &
nohup启动日志

http://www.dtcms.com/a/512194.html

相关文章:

  • RabbitMQ 自动化脚本安装方案
  • 前端三驾马车(HTML/CSS/JS)核心概念深度解析
  • Debug——主机无法访问虚拟机中Docker开启的容器
  • 网站配色与布局凡客诚品公司介绍
  • 怎么用企业网站做营销商城小程序多少钱
  • 大模型推理中的 Prefill/Decode 分离技术的一些思考
  • PCIe 枚举设备 学习
  • Linux外设驱动模块加载底层原理深度剖析
  • NAS文件远程同步攻略:群晖CloudSync进阶,告别U盘拷贝时代!
  • 关于网站建设请示校园二手交易网站值得做吗
  • 【C语言实战(39)】C语言排序算法实战:冒泡、选择与插入的对决
  • spark组件-spark core(批处理)-rdd血缘
  • 8 款企业微信 SCRM 工具功能对比分析
  • 手机网站建设的方法推广运营平台
  • stack、queue与priority_queue的用法解析与模拟实现
  • 【C++基本功】OOA OOD OOP面向对象彻底详解
  • 切换/获取root权限
  • 爬虫 beautifulSoup 方法
  • 深入BERT内核:用数学解密掩码语言模型的工作原理
  • 在webos中,在桌面上添加应用
  • 【Spring Security】授权(一)
  • 数据结构八大排序:快速排序-挖坑法(递归与非递归)及其优化
  • Docker 中卷、容器、镜像的区别
  • 学习React-21-受控组件非受控组件
  • 银行测试学习计划
  • 电商自建站中企动力网站建设公司
  • 怎么搜 织梦的网站唐山海港经济开发区人才网
  • Qt打包工具Enigma Virtual Box
  • 【同步/异步 日志系统】--- 介绍
  • 【软考备考】 数据与文件的加解密种类详解和使用场景