当前位置: 首页 > news >正文

(上)基于机器学习的图像识别——遥感图像分类(LeNet-5;AlexNet;VGGNet;GoogLeNet;ResNet)

遥感图像识别:

专业词汇:

kernel:卷积

目录

遥感图像分类 1.1 LeNet-5

视频来源:

任务:使用什么网络实现遥感图像的分类

LeNet-5结构:

遥感图像分类 1.2 AlexNet(冠军)

视频来源:

1主要i内容:

AlexNet结构:

遥感图像分类 1.3 VGGNet(亚军)

视频来源:

主要内容:

VGGNet结构:

遥感图像分类 1.4 GoogLeNet

视频来源:

GoogLeNet结构:

 遥感图像分类 1.5 ResNet

视频来源:

ResNet结构:


遥感图像分类 1.1 LeNet-5

视频来源:

遥感图像分类 1.1 LeNet-5_哔哩哔哩_bilibili

任务:使用什么网络实现遥感图像的分类

  •  基于MNIST的遥感数据集
  • LeNet-5搭建,训练,保存
  • LeNet-5调用和预测

LeNet-5结构:

基于MNIST的遥感数据集:

数据集放在了评论区,用来进行验证

从CSV文件中载入数据(数据采集):

  1. 读取CSV 文件
  2. 转换成数组
  3. 读取图片
  4. 读取标签
  5. 维度改变         4:05

总结:

  1. 数据采集  :
    按照列读取CSV 文件  标签信息  图片信息  维度处理  (和之前一样)
  2. 建立模型:
    和上节课一样
  3. 模型训练:
    增加轮数以达到更好的训练效果(max=80%)
  4. 模型测试:
    通过画图的方式,可视化正确率,遇到瓶颈
    对预测的位置信息转换成对应名称(通过数据方式实现)

遥感图像分类 1.2 AlexNet(冠军)

视频来源:

遥感图像分类 1.2 AlexNet_哔哩哔哩_bilibili

1主要i内容:

  1. 遥感图像的载入
  2. AlexNet结构与创新
  3. AlexNet搭建,训练,预测

AlexNet结构:

去网上找遥感图片

载入数据:

  1. 按照路径读取(相对路径)
  2. 预处理
    归一化——水平翻转4:04——批大小——随机——尺寸——独热编码
  3. 基础知识:
    步长 Stride & 加边 Padding &参数 Param
    卷积后尺寸=(输入图像大小-卷积核大小+加边像素数)/步长 +1
    Tensorflow默认:Padding='valid'(丢弃),strides=1
    设置:Padding=same':保证输出和输出尺寸不变,自动设置填充
    参数:
    卷积层:(卷积参数(卷积核各部分)+偏置参数)*卷积核的个数
    池化层:不需要训练参数
    全连接层:神经元连接权重+偏置参数

模型搭建:ReLU&Dropout

模型训练:learning_rate&batch_size


遥感图像分类 1.3 VGGNet(亚军)

视频来源:

遥感图像分类 1.3 VGGNet_哔哩哔哩_bilibili

主要内容:

  1. VGGNet 结构与创新
  2. VGGNet训练与预测
  3. 迁移学习训练VGGNet

VGGNet结构:

数据载入方式和上节课一样

感受视野 Receptive Field
定义:输出层一个元素对应输入层区域的大小。
计算:感受视野=(上一层感受视野-1)*步长 +卷积核尺寸
VGGNet提出:

堆叠两个3*3卷积核替代一个5*5卷积核
堆叠三个3*3卷积核替代一个7*7卷积核。
相同感受视野,训练参数量减少。

迁移学习:


遥感图像分类 1.4 GoogLeNet

视频来源:

遥感图像分类 1.4 GoogLeNet_哔哩哔哩_bilibili

  1.  GoogLeNet结构
  2. GoogLeNet创新
  3. GoogLeNet训练与预测

GoogLeNet结构:

Inception模块:

输入为28*28*192(*不考虑偏置项)
直接32个5X5                                                  卷积参数:5*5*192*32=105600
先使用16个1X1卷积降维,再使用32个5X5   卷积参数:1*1*192*16+5*5*16*32=15872

Padding问题:
TensorFlow中 padding= 'same'
输出图像的长和宽=输入图像/步长(结果向上取整)
*如果步长为1,卷积、池化操作不改变图像的长宽。

参考NIN网络:

使用全局平均化代替全连接层,避免全连接层带来的大量训练参数


遥感图像分类 1.5 ResNet

视频来源:

遥感图像分类 1.5 ResNet_哔哩哔哩_bilibili

ResNet结构:

  Batch Normalization 批量归一化:
每一层输入的时候,先做一个归一化处理,然后在进入网络的下一层
避免梯度消失和爆炸,训练更稳定

退化现象(不同于过拟合):
网络层数越多,训练集loss逐渐下降,之后趋于饱和,继续增加网络深度的话,训练集loss反而更大  

捷径分支:

模型搭建:

残差模块: 

最后附上本人粗浅的见解,感觉以上这五个网络结构可以看成处理(机器学习图像)/(遥感图像分类的五种(数学方法)/(函数方法

相关文章:

  • 局域网自动识别机器名和MAC并生成文件的命令
  • 自然语言处理NLP入门 -- 第九节NLP 实战项目 1:情感分析系统
  • 学习dify第二天-web前篇
  • 【C++】防止机械/移动硬盘休眠 - NoSleepHD
  • start DL from stratch (2)!!!
  • 【AI+智造】南京江北新区制造业特点分析及智慧设备运维诊断开发方案
  • RocketMQ的运行架构
  • [特殊字符]【CVPR2024新突破】Logit标准化:知识蒸馏中的自适应温度革命[特殊字符]
  • 中科大 计算机网络原理 第一章 1.6分组延迟、丢失和吞吐量 笔记
  • 如何把网络ip改为动态:全面指南
  • 一个基于C# Winform开源免费的通用快速开发框架,内置完整的权限架构!
  • python爬虫报错信息解决方法
  • C++22——哈希
  • 基于Springboot博物馆文博资源库系统【附源码】
  • 传输层协议TCP
  • Python从0到100(八十九):Resnet、LSTM、Shufflenet、CNN四种网络分析及对比
  • linux学习笔记3
  • Spring IoC
  • kafka consumer 手动 ack
  • 详解直方图均衡化
  • 高端公司网站建设/搜索引擎seo关键词优化
  • 支付宝网站支付接口/seo搜索引擎优化心得体会
  • 重庆网站建设搜外/黄页网站推广app咋做广告
  • 做网站可以赚钱吗知乎/uc信息流广告投放
  • 两款WordPress加速/华为seo诊断及优化分析
  • 扬州网站建设多少钱/小说网站排名前十