当前位置: 首页 > news >正文

FCN语义分割笔记(1)

一、什么是语义分割

定义:为图像中的每一个像素赋予一个类别标签,语义分割提供更精细、像素级别的理解。比如有一个图片,图片里有一个西瓜和勺子,经过语义分割模型,输出一个结果,如果原来的图片是512*512,那么理论上来说要对应这么多个像素并且背景也算一个类别,每个像素掩码+类别信息。

应用场景:自动驾驶(道路、行人、车道线、交通标志)、医学图像分析(分割器官、肿瘤、病灶区域)、遥感图像处理(建筑物、农田、湖泊)

二、发展历史

传统模型:基于阈值、基于图像分层和纹理、基于聚类、基于边缘

深度学习模型:FCN(2014):全卷积神经网络,第一个将传统分类的CNN改造成像素级预测的架构,开创了基于深度学习的语义分割新时代。U-Net(2015):为医学图像分割设计,在参数量不打的前提下一九能跑出非常不错的效果。DeepLab(2016-2018):v1引入空洞卷积+CRF,v2加入ASPP多尺度特征,v3去除CRF强化ASPP,v3+加入E-D提升边缘精度。

三、FCN原理 

一般卷积模型进行分类的模型结构是:输入固定大小的图片,然后经过卷积层和池化层的特征提取,最终输出的特征图有一个特性,就是特征图的高宽下采样一定倍数,通道数变大,然后将特征图通过一定的方法进行展平和全连接层对接,最后一层全连接层的神经元个数应是类别的数量,最后利用softmax函数映射最后一层神经元的输出,输出值为概率值,所有值相加等于1.

利用FCN模型进行语义分割任务,本质上也是一个分类任务,只不过从任务的本质来说是对图像进行像素级的分类,并且模型的输入图片可以是任意大小(没有全连接层),模型的特征提取网络可以是任意卷积神经网络(可以是VGG也可以是ResNet等等),最后网络模型的输出为和输入图像一样高宽的高维向量。可以理解为输出一个概率矩阵。

输出解析:

假设有20类,那么输出的结果是21类,多出来的一个类为背景。

http://www.dtcms.com/a/282153.html

相关文章:

  • 大语言模型(LLM)训练的教师强制(Teacher Forcing)方法
  • 人工智能之数学基础:神经网络之多样本矩阵参数求导
  • Java线程创建与运行全解析
  • 什么是数据仓库?数据库与数据仓库有什么关系?
  • 消息转换器--通过此工具进行时间转换
  • 7.isaac sim4.2 教程-Core API-数据记录
  • 多态,内部类(匿名内部类),常用API(1)
  • LVS:高性能负载均衡利器
  • DAC0832的扩展方式有哪些?
  • [硬件电路-28]:从简单到复杂:宇宙、芯片与虚拟世界的共通逻辑
  • Uniswap V2/V3/V4简短说明
  • 定制安全组-openstack定制安全组禁止特定云主机访问其他云主机
  • ST算法和ST表
  • 在Next.js里玩转pdf预览
  • django在线音乐数据采集-22647
  • Django+Celery 进阶:Celery可视化监控与排错
  • JobSet:Kubernetes 分布式任务编排的统一解决方案
  • flink sql读hive catalog数据,将string类型的时间戳数据排序后写入kafka,如何保障写入kafka的数据是有序的
  • 从零开始的云计算生活——番外4,使用 Keepalived 实现 MySQL 高可用
  • Django 接口自动化测试平台实现(一)
  • 蓝光三维扫描技术:汽车轮毂轴承模具检测的高效解决方案
  • 【tower】Rust tower库原理详解以及axum限流实战
  • 在新闻资讯 APP 底部切换不同类型界面,部分界面可以通过 ViewPager 实现滑动切换
  • 枫清科技参编的《人工智能知识工程指南(1.0)》发布
  • 压力测试Apache Bench(ab)
  • 从缓存 CAS 看Kimi K2使用的MuonClip优化器
  • 电力政策解读:山东电网新型储能集中调用的能源管理系统实现点
  • LinkedList集合源码解析
  • 超级天才如何批量制造?天才成长引擎模型:超级天才 = (学习速度泛化力 × 创造力 × 专注力) × 驱动力
  • python基础②-数据结构