当前位置: 首页 > news >正文

语义分割概述

分割概述

文章目录

  • 分割概述
    • Preliminaries
      • 卷积模式
      • 语义分割 vs 实例分割 vs 全景分割
      • 转置卷积
    • 相关工作
      • FCN(Fully Convolutional Network)
      • U-Net
      • PSPNet 2016
      • DeepLab
      • SAM
      • DINOv2
      • Grounded SAM

Preliminaries

卷积模式

在这里插入图片描述

语义分割 vs 实例分割 vs 全景分割

在这里插入图片描述

转置卷积

在这里插入图片描述

相关工作

FCN(Fully Convolutional Network)

在这里插入图片描述
贡献:

  • FCN代替全连接FFN,以适应不同size的图片输入;
    在这里插入图片描述

  • 转置卷积(上采样)
    在这里插入图片描述

  • Skip结构
    结合细层和粗层可以让模型做出尊重全局结构的局部预测,获取更多细粒度的特征和语义。

在这里插入图片描述

U-Net

参考:

  1. https://www.bbbdata.com/text/976
  2. https://blog.csdn.net/AggressiveYu/article/details/151256739
  3. https://www.cnblogs.com/carpell/p/18908044

U-net的设计初衷是为了解决医学图像分割中数据稀缺的挑战。
在这里插入图片描述
贡献

  • 模型
    U-Net的结构得名于它的形状,像一个英文字母“U”。它可以清晰地分为两个部分:​左侧的编码器(收缩路径)​​ 和 ​右侧的解码器(扩张路径)​。

  • 数据增强
    在这里插入图片描述

  • 损失函数
    为交叉熵损失中的每个像素级(pixel-wise) 计算权重,重点加大接触细胞间背景区域的权重。
    在这里插入图片描述
    在这里插入图片描述

  • 其他
    在这里插入图片描述

PSPNet 2016

在这里插入图片描述
上下文关系是通用且重要的,特别是对于复杂的场景理解。如上图,一架飞机很可能在跑道上或在天空中飞行,而没有在道路上空飞行。FCN根据黄色框中的船的外观将其预测为“汽车”。但众所周知,汽车很少能过河。缺乏收集上下文信息的能力会增加错误分类的机会。

在这里插入图片描述
PSPNet 为像素级场景解析提供了有效的全局上下文先验金字塔池模块可以收集信息层次,比全局池化更具代表性。

金字塔池模块融合了四种不同金字塔尺度下的特征。以红色突出显示的最粗略级别是全局池化,以生成单个bin输出。以下金字塔级别将特征图划分为不同的子区域,并形成不同位置的汇集表示。金字塔池化模块中不同级别的输出包含大小不一的特征图。为了保持全局特征的权重,作者在每个金字塔级别后使用1×11×11×1卷积层 ,在金字塔的级别大小为N的情况下,将上下文表示的维度降低到原始维度的 1/N1/N1/N 。然后,我们直接对低维特征图进行上采样,通过双线性插值获得与原始特征图相同大小的特征。最后,将不同级别的特征连接起来,作为最终的金字塔池化全局特征。

DeepLab

参考:

  1. https://blog.csdn.net/fanxuelian/article/details/85145558

SAM

在这里插入图片描述
SAM借鉴了NLP领域的Prompt策略,通过给图像分割任务提供Prompt提示来完成任意目标的快速分割。Prompt类型可以是「前景/背景点集、粗略的框或遮罩、任意形式的文本或者任何指示图像中需要进行分割」的信息。如下图(a)所示,模型的输入是原始的图像和一些prompt,目标是输出"valid"的分割,所谓valid,就是当prompt的指向是模糊时,模型能够输出至少其中一个mask。

DINOv2

在这里插入图片描述

Grounded SAM

在这里插入图片描述

http://www.dtcms.com/a/441795.html

相关文章:

  • 数据结构之排序算法
  • 绍兴网站建设优化手机企业网站建设开发
  • 偏导数解释
  • Linux内核与设备管理:USB存储驱动usb_storage/uas的安全卸载与复原
  • fallocate: fallocate failed: Text file busy
  • visio实现扇形图绘制的方式方法-以三等分扇形为例
  • 以太坊私有链搭建与智能合约部署指南
  • 网站开发 教学大纲网页设计图片与图片的位置
  • python+flask_socketio+pyautogui实现简易远程桌面功能
  • flask_socketio+pyautogui实现的具有加密传输功能的极简远程桌面
  • 深入了解linux网络—— TCP网络通信(上)
  • Android Jetpack 核心组件实战:ViewModel + LiveData + DataBinding 详解
  • 商务厅网站建设意见怎么做网站注册推广
  • Fragment 崩溃恢复后出现重叠问题的复现方式
  • 设计模式(C++)详解——策略模式(2)
  • 使客户能够大规模交付生产就绪的人工智能代理
  • Layui 前端和 PHP 后端的大视频分片上传方案
  • 无状态HTTP的“记忆”方案:Spring Boot中CookieSession全栈实战
  • Java 内存模型(JMM)面试清单(含超通俗生活案例与深度理解)
  • 2015网站建设专业建网站设计公司
  • vue+springboot项目部署到服务器
  • QT肝8天17--优化用户管理
  • QT肝8天19--Windows程序部署
  • 【开题答辩过程】以《基于 Spring Boot 的宠物应急救援系统设计与实现》为例,不会开题答辩的可以进来看看
  • 成都seo网站建设沈阳网站建设推广服务
  • 网站栏目名短链接在线生成官网免费
  • Task Schemas: 基于前沿认知的复杂推理任务架构
  • 第三十七章 ESP32S3 SPI_SDCARD 实验
  • 企业营销型网站特点企业信息查询系统官网山东省
  • docker-compose 安装MySQL8.0.39