当前位置: 首页 > news >正文

【CV 图像分割】①——目标分割介绍

一、目标分割介绍

  • 目标检测仅需要框出每个目标的包围盒
  • 语义分割需要进一步判断图像中哪些像素属于哪个目标,但不区分属于相同类别的不同实例

图像分割定义

  • 定义:在计算机视觉领域,图像分割(Object Segmentation)指的是将数字图像细分为多个图像子区域(像素集合)的过程,并且同一个子区域内的特征具有一定相似性,不同子区域的特征呈现较为明显的差异
  • 图像分割的目标就是为 图像中的每个像素分类,应用领域广泛

深度学习使得图像分割的准确率提高了很多

任务类型

(1)任务描述

简单来说,目标是输入一个RGB彩色图片(height×width×3height \times width \times 3height×width×3)或者一个灰度图(height×width×1height \times width \times 1height×width×1),然后输出一个包含各个像素类别标签的分割图

上面与 处理分类值的方式类似,预测目标可以采用one-hot编码,即为每一个可能的类创建一个输出通道。通过取每个像素点在各个channel的argmax可以得到最终的预测分割图

(2)任务类型

目前的目标分割任务主要有两类:语义分割实例分割

  • 语义分割:不用区分类别

  • 实例分割:需要区分不同个体


目前图像分割的任务主要集中在 语义分割

常用开源数据集

图像分割常用数据集是PASCAL VOC,城市风光数据集,coco数据集

(1)VOC数据集

(2)城市风光Cityscapes数据集

该数据集的标注效果可视化(语义分割)如下:

评价指标

图像分割中通常使用许多标准来衡量算法的精度。这些标准通常是像素精度及IOU的变种

前提:

(1)像素精度

这是一种最简单的度量方法

Pixel Accuracy(PA,像素精度):预测正确的像素占总像素的比例为PA=∑i=0kpii∑i=0k∑j=0kpijPA = \frac{\sum_{i = 0}^{k} p_{ii}}{\sum_{i = 0}^k \sum_{j = 0}^k p_{ij}}PA=i=0kj=0kpiji=0kpii

  • 注意:对于样本不均衡的情况(例如医学图像分割中,背景与标记样本之间的比例往往严重失衡),并不适合使用这种方法进行度量。

(2)平均像素精度

Mean Pixel Accuracy(MPA,平均像素精度):计算每个 类内 被正确分类的像素数的比例,之后求所有类的平均值。
MAP=1k+1∑i=0kpii∑j=0kpijMAP= \frac{1}{k + 1}\sum_{i = 0}^{k} \frac{p_{ii}}{\sum_{j = 0}^k p_{ij}}MAP=k+11i=0kj=0kpijpii

(3)平均交并比

Mean Intersection over Union(MIOU,平均交并比):为语义分割的标准度量,其计算两个集合的交集和丙级之比,在语义分割问题中,这两个集合为真实值(ground truth)给预测值(predicted segmentation)。交集为预测正确的像素数(intersection),并集为预测或真实值为类的和减去预测正确的像素,在每个类上计算IOU,然后求平均即可。

MIOU=1k+1∑i=0kpii∑j=0kpij+∑j=0kpji−piiMIOU = \frac{1}{k + 1} \sum_{i = 0}^{k} \frac{p_{ii}}{\sum_{j = 0}^kp_{ij} + \sum_{j = 0}^k p_{ji}-p_{ii}}MIOU=k+11i=0kj=0kpij+j=0kpjipiipii

MIOU 计算的是计算A与B的交集(橙色部分)与A与B的并集(红色+橙色+黄色)之间的比例,在理想状态下A与B重合,两者比例为1

http://www.dtcms.com/a/339237.html

相关文章:

  • 网络编程day4
  • 牛客面经 - 2025/8/19
  • C++高频知识点(二十八)
  • 数据库-MYSQL配置下载
  • 前端性能优化实战手册:从网络到运行时,一套可复制落地的清单
  • 基于提示词工程和MCP构建垂直Agent应用
  • Go语言中的优雅并发控制:通道信号量模式详解
  • JS 中的 this
  • AI-调查研究-55-机器人 百年进化史:从Unimate到人形智能体的技术跃迁
  • Navicat 使用超详细教程:从下载到实战案例
  • Vue.prototype 的作用
  • AJAX (一)
  • 【深度学习-pytorch】mnist数字识别
  • Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的多语言翻译与文化适应性优化
  • go.uber.org/zap 日志库高性能写入
  • 结合BI多维度异常分析(日期-> 商家/渠道->日期(商家/渠道))
  • 常见BI工具
  • 变电站智能辅助监控系统:结构框架、功能模块及配套设备指南
  • 【国内电子数据取证厂商龙信科技】Python数据分析环境搭建
  • 科技云报到:AI推理破局,金融服务如何“逆天改命”
  • JavaWeb开发笔记合集
  • 工厂MES管理系统的五大核心应用场景
  • 功能上新:燕千云ITSM如何让高频重复问题自动总结推送
  • Cursor+Apifox MCP Server接口自动化新范式探索
  • 二分法专题训练
  • 基础分类决策树
  • 疯狂星期四文案网第44天运营日记
  • 力扣hot100:找到字符串中所有字母异位词(滑动窗口 + 字符频率数组)(438)
  • Java实现一个加法运算
  • 《Java 多线程全面解析:从基础到生产者消费者模型》