当前位置: 首页 > news >正文

使用Tensorrt的一般步骤

使用Tensorrt的一般步骤

TensorRT的使用包括两个阶段:build and deployment。

build:该阶段主要完成模型转换(从caffe或TensorFlow到TensorRT),如下图所示,在模型转换时会完成前述优化过程中的层间融合,精度校准。这一步的输出是一个针对特定GPU平台和网络模型的优化过的TensorRT模型,这个TensorRT模型可以序列化存储到磁盘或内存中。存储到磁盘中的文件称之为 planfile。

Deploy:该阶段主要完成推理过程,如下图所示。将上一个步骤中的plan文件首先反序列化,并创建一个 runtime engine,然后就可以输入数据(比如测试集或数据集之外的图片),然后输出分类向量结果或检测结果。

以onnx模型为例检测介绍,主要分为3步,如下图所示,第一步是导入模型,这包括从磁盘上保存的文件加载模型,并将其从原始框架转换为TensorRT网络。ONNX是表示深度学习模型的标准,使它们能够在框架之间传输(Caffe2、Chainer、CNTK、paddle、PyTorch和MXNet都支持ONNX格式)。接下来,基于输入模型、目标GPU平台和指定的其他配置参数,构建一个优化的TensorRT引擎。最后一步是向TensorRT引擎提供输入数据以执行推理。

需要用的tensorrt的组件如下:

  • ONNX解析器:以ONNX格式的经过训练的模型作为输入,并用TensorRT填充网络对象
  • Builder:在TensorRT中获取一个网络并生成一个为目标平台优化的引擎
  • Engine:获取输入数据,执行推理并发出推理输出
  • Logger:与生成器和引擎关联的对象,用于在生成和推断阶段捕获错误、警告和其他信息

大家可以根据以下coding的例子进行相关实验:

>> git clone https://github.com/parallel-forall/code-samples.git
>> cd code-samples/posts/TensorRT-introduction
>> wget https://s3.amazonaws.com/onnx-model-zoo/resnet/resnet50v2/resnet50v2.tar.gz // Get ONNX model and test data
>> tar xvf resnet50v2.tar.gz # unpack model data into resnet50v2 folder
>> apt-get update
>> apt install libprotobuf-dev protobuf-compiler        # install protobuf to read the input data which is in .pb format
>> git clone --recursive https://github.com/onnx/onnx.git # pull onnx repository from github
>> cd onnx
>> cmake . # compile and install onnx
>> make install -j12
>> cd ..
>> make # compile the TensorRT C++ sample code

相关文章:

  • FastAPI学习-27 使用@app.api_route() 设置多种请求方式
  • 华为云云耀云服务器L实例评测|华为云上的CentOS性能监测与调优指南
  • 9-2-Dataset创建-import调用
  • Android 10.0 framework层实现app默认全屏显示
  • VNF1048F高侧开关控制器具有智能保险丝保护,适用于12v, 24v和48v汽车应用
  • 跳表C语言
  • “华为杯”研究生数学建模竞赛2019年-【华为杯】F题:智能飞行器航迹规划模型(下)(附优秀论文及Pyhton代码实现)
  • 几种预训练模型微调方法和peft包的使用介绍
  • 奥威BI系统:做数据可视化大屏,又快又简单
  • SpringCloud小项目——订单积分商城 使用Nacos、Open Feign、Gateway、Sentinel技术栈
  • 一般香港服务器带宽选多大够用?(带宽计算方法)
  • 两数之和[中等]
  • cesium 地图蒙版遮罩效果
  • 短视频视频号矩阵系统源码独立部署开发对接
  • vue3使用腾讯地图选择地点
  • 【被误用的feof与文件操作读取结束的正确判定】
  • Adobe Premiere Pro:掌控视频剪辑的魔法之手,让你的创作腾飞!
  • 【算法|动态规划No.17】leetcode64. 最小路径和
  • jar 命令启动java 指定配置文件路径 jar如何启动
  • 「才得吹嘘身渐稳」,也来谈谈大模型
  • 西甲上海足球学院揭幕,用“足球方法论”试水中国青训
  • 工行回应两售出金条疑似有杂质:情况不属实,疑似杂质应为金条售出后的外部附着物
  • 中日有关部门就日本水产品输华问进行第三次谈判,外交部回应
  • 以总理内塔尼亚胡称决心彻底击败哈马斯
  • 万玲、胡春平调任江西省鹰潭市副市长
  • 澎湃研究所“营商环境研究伙伴计划”启动