当前位置: 首页 > news >正文

网站模板平台资源搜索引擎seo关键词优化

网站模板平台资源,搜索引擎seo关键词优化,做网站编辑需要会什么,网站维护是什么工作MaskFormer 背景 语义分割:任务是为图像中每一个像素分配一个类别标签,传统方式通常视为逐像素分类,模型会输出一个与输入图像尺寸相同的特征图,每个位置是一个类别概率向量。 实例分割:任务不仅需要区分类别&#xff…

MaskFormer

背景

语义分割:任务是为图像中每一个像素分配一个类别标签,传统方式通常视为逐像素分类,模型会输出一个与输入图像尺寸相同的特征图,每个位置是一个类别概率向量。

实例分割:任务不仅需要区分类别,还要区分同一类别的不同个体,传统上,这类任务通常使用掩码分类,即模型先检测出物体框,再为每个框预测一个二进制掩码

本文提出:

掩码分类(mask classification)本身就足够通用,可以用完全相同的模型、损失函数和训练流程,以统一的方式同时解决语义级和实例级的分割问题。

语义分割=实例分割+实例分类
在这里插入图片描述

逐像素分类(左边)

  • 模型最终输出是 [H x W x 类别数]
  • 使用“逐像素分类损失”

掩码分类(右边):

  • 掩码分类预测一组二进制掩码,并为每个掩码分配一个类。
  • 每个像素的二进制掩码损失和分类损失
模型结构

在这里插入图片描述
MaskFormer包含三个模块:

  • 像素级模块:其职责是处理输入图像,提取图像特征,并生成高分辨率,精细的像素级特征表示,这特征是后续生成掩码的基础
  • Transformer模块:它接收来自像素级模块的信息以及一组可学习的查询(query),通过自注意力和交叉注意力机制,输出 N 个全局的、抽象的特征向量。每个向量都编码了图像中某个潜在物体或区域的全局信息。
  • 分割模块:这是一个轻量级的预测头,它将 Transformer 模块输出的每个抽象特征向量,分别转换为:
    • 一个类别概率分布(pip_ipi):预测这个向量所代表的区域属于哪个类别
    • 一个二进制掩码(mjm_jmj):预测这个区域在图像中具体的像素级位置

在推理时,模型输出的就是这N个对,再通过简单的规则,就能够组装成最终的语义分割图或者实例分割图

像素级模块
  • Backbone:用于提取图像特征,其输出通常是一个空间分辨率较低,但通道数丰富,语义信息强的特征图
  • 像素解码器(Pixel Decoder):负责将Backbone输出的低分辨率特征图逐步上采样,恢复到与原图相同的大小(H x W),这个过程的输出不再是简单的特征图,而是被称作 “逐像素嵌入”,它为每个像素位置都赋予了一个特征向量
Transformer 模块
  • 输入
    • 由Backbone提取的,包含丰富视觉信息的特征图
    • 可学习查询向量(Queries):N 个可训练的向量,可以理解为模型需要寻找的“N种不同目标或者区域的模板”
  • 过程:通过Transformer解码器的交叉注意力机制,每个“查询”都会主动地去“查询”和“收集”整个图像特征 F中与自己相关的信息。
  • 输出:经过多层计算后,每个查询向量都变成了一个信息丰富的“每片段嵌入” Q,它编码了某个特定目标的全局信息
分割模块:从抽象嵌入到具体预测

此模块负责将Transformer输出的抽象嵌入Q解码为具体的类别和掩码预测,它包含两条并行的通路:

  • 类别预测通路

    • 一个线性分类器(全连接层)接一个softmax函数,直接作用在每个片段嵌入 Q上,输出一个 K+1维的概率分布 pip_ipi,表示这个片段属于各个类别(包括“无对象”)的概率。
  • 掩码预测通路

    • 步骤一(生成掩码嵌入): 用一个小的MLP将每个全局的片段嵌入 Q转换为一个“掩码嵌入” E_mask。这个掩码嵌入可以看作是该目标掩码的特征编码。
    • 步骤2(生成掩码本身): 这是非常巧妙的一步。掩码的生成是通过计算掩码嵌入 E_mask 与像素级模块输出的高分辨率逐像素嵌入 E_pixel的点积(相似度)来实现的。
损失函数:
  • 分类损失:标准的交叉熵损失,用于优化类别预测的准确性
  • 掩码损失: 用于优化预测掩码的形状准确性
    • Focal Loss:对难分类的像素点(例如边界)给予更高的关注,优化掩码的细节
    • Dice Loss:接优化预测掩码和真实掩码之间的重叠面积(交并比),非常适用于评估分割效果
http://www.dtcms.com/a/526052.html

相关文章:

  • 优秀网站案例欣赏明会红网站
  • 优秀企业网站案例附近学电脑培训班
  • 不知此网站枉做男人的网站微网站 报价
  • 蔬菜网站模板城乡与建设厅网站首页
  • 【c++】this指针学习与理解
  • 【若依】若依框架中实现国际化多语言切换的步骤
  • 重庆城乡建设子网站一个完整的工程项目流程
  • 网站建设 安庆com网站怎么注册
  • C primer plus (第六版)第十一章 编程练习第16题
  • 上海制作网站的网站wordpress分享获得优惠
  • 客户做网站嫌贵了国内常用的crm系统
  • 最简单的网站建设wordpress多语种
  • 吉林省交通建设集团有限公司网站做网站的程序
  • 二手购物网站建设方案自媒体app下载
  • 做网站中心学校网页设计模板html代码免费
  • 淘客宝网站备案号如何弄四川建设招标网站首页
  • 使用ssrs矩阵
  • C++ 动态规划(Dynamic Programming)详解:从理论到实战
  • 网站推广软件免费版可tvseo排名第一
  • 盐城市建设工程网站电商直播培训
  • 福永网站推广大名专业做网站
  • 免费网页制作网站制作ppt的软件电脑版免费
  • 网站开发与网页后台开发最有效的线下推广方式
  • 偷的网站怎么做seo湖南省住建云公共信息服务平台
  • C++学习笔记——运算符重载
  • 怎样推广网站开什么店投资小利润高
  • 基于 Prometheus + Alertmanager + Grafana + Loki 的可视化监控与告警系统搭建实战
  • 如何做一款app需要多少钱网站seo收费
  • 电商网站设计公司皆选亿企邦怎么快速排名
  • MySQL使用技巧:字段内容的替换、拼接