基于Mask R-CNN和TensorRT的高效草莓实例分割

An efficient strawberry segmentation model based on Mask R-CNN and TensorRT
---------------------------------------------------------------------------------------------------------------------------
研究背景:人工智能在农业应用广泛,草莓生产消费增长但采摘成本高、耗时久,自动采收是解决方案,然而光照、遮挡等因素给果实检测分割带来困难,现有深度学习模型实时性不足,需要高精度且实时模型
研究内容:提出高效Mask R-CNN模型用于草莓果实实例分割,用Detectron2和NVIDIA TAO两种方法训练,结合NVIDIA TensorRT优化,从FPS、模型大小、mAP值评估模型效率
研究思路:针对草莓采摘难题,聚焦果实实例分割,利用深度学习技术,通过两种训练方法结合模型优化,探索兼具高精度和实时性的草莓分割模型
---------------------------------------------------------------------------------------------------------------------------

Mask R-CNN结构

Dectectron2、NVIDIA TAO工具包,NVIDIA TensorRT都是用来做人工智能领域的目标检测与图像分割任务的
Dectectron2:是一套“训练框架”,可以基于它快速搭建模型,利用预训练的基础模型在自己的数据集上训练,节省从零开始的时间,让模型学会识别和分割图像里的目标
NVIDIA TAO工具包:是一套“优化工具”,基于迁移学习对模型微调,让模型在GPU、CPU或嵌入式设备上跑得更快、更准
NVIDIA TensorRT:是“推理加速器”,把训练好的模型进一步优化,让它能在实时场景中快速运行,还能把模型压缩到嵌入式设备上用,不过需要先格式转换
NVIDIA的“TAO工具箱”+“TensorRT加速器”,教一个教Mask R-CNN的“机器人”认东西、分区域,这个工具箱里有不同版本的“骨架”(ResNet-10、50这些),这些骨架已经在谷歌的OpenImages数据集上“预习”过了
