当前位置: 首页 > news >正文

PyTorch笔记7----------计算机视觉基础

1.颜色空间

  • RGB色彩模式
    • RGB色彩模式是工业界的一种颜色标准
    • 通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及他们相互之间的叠加来得到各式各样的颜色
    • 红、绿、蓝三个颜色通道每种色各为0~255阶亮度
    • 一幅图片包含,宽(W)、高(H)、通道数(C),RGB图片的通道数为3,即表示为H*W*3
  • HSV色彩模式
    • 色相(Hue):指物体传导或反射的波长。即色彩,取0到360度的数值来衡量
    • 饱和度(Saturation):又称色度,是指色彩的强度或纯度,取值范围为0%~100%
    • 明度(Value):表示颜色明亮的程度,取之范围为0%(黑)到100%(白)
  • 灰度图
    • 灰度图通常由一个unit8、unit16、单精度类型或者双精度类型的数组描述
    • 一个灰度图,可以看做一个M*N的矩阵,矩阵中每一个元素与图像的一个像素点对应
    • 灰度图中,0代表黑色,1或255代表白色

2.图像处理概念

  • 亮度、对比度、饱和度
    • 亮度:图像的明亮程度,在单色图像中,最高的值应该对应于白色,最低的值应当对应于黑色。调整图像亮度时,通常在图像矩阵上加减一个值。通常用于RGB图进行数据增强。
    • 对比度:图像暗和亮的落差值,即图像最大灰度级和最小灰度级之间的差值,差异范围越大代表对比度越大,差异范围越小代表对比越小。调整图像对比度度时,通常在图像矩阵上加乘一个值,如果这个值大于1,则对比度增加,小于1则对比度减小。通常用于RGB图进行数据增强。
    • 饱和度:图像颜色种类的多少,饱和度越高,颜色种类越多,外观上看起来图像会更鲜艳。通常用于HSV/HSI/HSL色彩空间上进行数据增强
  • 平滑、降噪
    • 图像平滑是指用于突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分的图像处理方法,使图像亮度平缓渐变,减小突变梯度,改善图像质量
  • 锐化、增强
    • 锐化时通过增强高频分量来减少图像中的模糊,增强图像细节边缘和轮廓,增强灰度反差,便于后期对目标的识别和处理。锐化处理在增强图像边缘的同时也增加了图像的噪声
  • 边缘提取算子
    • 通过微分的方式计算图像的边缘,边缘即色差大的点
  • 直方图均衡化
    • 直方图均衡化是将原图像通过某种变换,得到一幅灰度直方图为均匀分布的心图像的方法
    • 在对图像中像素个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减,从而达到清洗图像的目的
  • 图像滤波
    • 图像滤波可以更改或者增强图像
    • 通过滤波,可以强调一些特征或者去除图像中一些不需要的部分
    • 滤波是一个邻域操作算子,利用给定像素周围的像素的值决定此像素的最终输出值
    • 常见的应用包括去噪、图像增强、检测边缘、检测角点、模版匹配等
  • 形态学运算
    • 腐蚀:把图片“变瘦”,其原理是在原图的小区域内去局部最小值
    • 膨胀:把图片“变胖”,其原理是在原图的小区域内去局部最大值
    • 开运算:先腐蚀后膨胀
    • 闭运算:先膨胀后腐蚀
    • 形态学梯度:膨胀土减去腐蚀图,得到轮廓图
    • 顶帽:原图减去开运算后的图
    • 黑帽:闭运算后的图减去原图

3.特征工程

        特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优。

本文内容较短,主要是为了铺垫一下卷积神经网络😂😂

知识点为听课总结笔记,课程为B站“2025最新整合!公认B站讲解最强【PyTorch】入门到进阶教程,从环境配置到算法原理再到代码实战逐一解读,比自学效果强得多!”:2025最新整合!公认B站讲解最强【PyTorch】入门到进阶教程,从环境配置到算法原理再到代码实战逐一解读,比自学效果强得多!_哔哩哔哩_bilibili


文章转载自:
http://aposelene.dxwdwl.cn
http://brooklime.dxwdwl.cn
http://brachiopoda.dxwdwl.cn
http://anaesthetic.dxwdwl.cn
http://arthrosporous.dxwdwl.cn
http://basinet.dxwdwl.cn
http://anthracitic.dxwdwl.cn
http://batchy.dxwdwl.cn
http://chrp.dxwdwl.cn
http://adultly.dxwdwl.cn
http://alden.dxwdwl.cn
http://audiometric.dxwdwl.cn
http://armload.dxwdwl.cn
http://ceric.dxwdwl.cn
http://appeared.dxwdwl.cn
http://angle.dxwdwl.cn
http://bedaub.dxwdwl.cn
http://alogical.dxwdwl.cn
http://adios.dxwdwl.cn
http://celticize.dxwdwl.cn
http://apagoge.dxwdwl.cn
http://archaeoastronomy.dxwdwl.cn
http://acousma.dxwdwl.cn
http://blindworm.dxwdwl.cn
http://awless.dxwdwl.cn
http://applicatively.dxwdwl.cn
http://anemogram.dxwdwl.cn
http://agrotechnical.dxwdwl.cn
http://brimstone.dxwdwl.cn
http://agamid.dxwdwl.cn
http://www.dtcms.com/a/280644.html

相关文章:

  • OpenCV 伽马校正函数gammaCorrection()
  • MODIS_Landsat_Sentinel2星源分幅简述【20250715】
  • 视频编码中熵编码之基于上下文的变长编码(Huffman霍夫曼编码和指数哥伦布)
  • 【YOLOv11-目标检测】06-模型部署(C++)
  • 06_pt-table-sync 工具解决 MySQL 主从数据不一致
  • conda环境保存(后期再来整理)
  • etcd自动压缩清理
  • 2-Nodejs运行JS代码
  • iOS高级开发工程师面试——Swift
  • Fiddler 中文版抓包实战 构建标准化调试流程提升团队协作效率
  • echarts 绘制3D中国地图
  • React强大且灵活hooks库——ahooks入门实践之开发调试类hook(dev)详解
  • PostgreSQL 数据库中 ETL 操作的实战技巧
  • React源码6 三大核心模块之一:commit, finishConcurrentRender函数
  • 前端学习笔记:React.js中state和props的区别和联系
  • haproxy负载均衡
  • AntV G6 基础元素详解(React版)
  • 【PTA数据结构 | C语言版】创建哈夫曼树
  • 使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第二十一讲)
  • 【PDF识别改名】使用京东云OCR完成PDF图片识别改名,根据PDF图片内容批量改名详细步骤和解决方案
  • 同样是“跳转”,为何forward地址栏不变,redirect会变?
  • RNN、GRU 与 LSTM 计算成本深入对比
  • 基于光场相机的激光增材制造熔池温度场原位多眼监测​​
  • 【zynq7020】PL的“Hello LED”
  • FPGA高端图像ISP培训课程,提供工程源码+视频教程+FPGA开发板
  • Softhub软件下载站实战开发(十八):软件分类展示
  • 使用LNMP一键安装包安装PHP、Nginx、Redis、Swoole、OPcache
  • Vmware中安装的CentOS7如何扩展硬盘大小
  • 语言模型玩转3D生成:LLaMA-Mesh开源项目
  • 【鸿蒙HarmonyOS】鸿蒙app开发入门到实战教程(二):封装自定义可复用组件