当前位置: 首页 > news >正文

认知篇#12:基于非深度学习方法的图像特征提取

一、前言

有一个问题一直困扰着我,在机器学习发展之前,图像处理是依靠什么手段的呢?我们该怎样去提取图像的特征并进行修改呢,这有点像P图,确实值得深究。

图像特征提取是计算机视觉中的重要任务,用于从图像中提取具有辨识性的局部信息,这些信息通常可以用于匹配、分类、目标跟踪等任务。常见的特征提取方法包括 SIFTSURFORB 等,它们各自有不同的原理和效果。

二、特征提取方法

1. SIFT (Scale-Invariant Feature Transform)

原理:

  • SIFT 是一种尺度不变的特征提取方法,通过多尺度的高斯金字塔来查找不同尺度下的关键点,并使用这些关键点的邻域区域提取描述符。
  • 步骤:
    • 关键点检测:通过检测图像中的极值点,找到稳定的特征点,这些点在尺度空间中具有不变性。
    • 方向赋值:为每个关键点分配一个主方向,使得该特征在旋转变换下也能保持不变。
    • 描述符计算:通过计算关键点邻域的梯度信息,生成一个特征描述符,具有旋转、尺度、仿射等不变性。

效果:

  • SIFT 在图像旋转、尺度变化、光照变化等情况下具有良好的不变性,能够提取出对场景识别和匹配非常有用的特征。
  • 然而,由于其计算量较大,速度较慢,不适合实时应用。

2. SURF (Speeded-Up Robust Features)

原理:

  • SURF 是对 SIFT 的改进,主要通过加速计算过程来提高处理速度。SURF 使用 Haar-like 特征 来近似计算图像的 Hessian 矩阵,从而快速检测和描述图像的特征点。
  • 步骤:
    • 特征点检测:使用 Hessian 矩阵来检测尺度空间中的关键点,并通过快速的积分图计算提高效率。
    • 方向赋值:类似于 SIFT,SURF 也会为每个关键点计算主方向,确保旋转不变性。
    • 描述符计算:利用关键点周围的 Haar 特征来计算描述符,比 SIFT 更加高效。

效果:

  • SURF 计算速度比 SIFT 更快,但仍然保持较好的鲁棒性。
  • 适用于需要处理大规模图像或进行实时应用的场景,但由于其使用的专利技术,在一些商业应用中可能需要支付许可费用。

3. ORB (Oriented FAST and Rotated BRIEF)

原理:

  • ORB 是基于 FAST(Features from Accelerated Segment Test) 关键点检测算法和 BRIEF(Binary Robust Independent Elementary Features) 描述符的组合,提出了一种高效且能适应旋转的特征提取方法。
    • FAST:是一种快速的角点检测算法,能够有效地检测到图像中的角点特征。
    • BRIEF:是一种基于二进制字符串的描述符,通过比较关键点周围像素对的亮度差异来生成描述符。
    • ORB 通过对 FAST 关键点进行方向赋值并使用旋转不变的 BRIEF 描述符,能够处理图像的旋转不变性。

效果:

  • ORB 的计算速度非常快,且对旋转和尺度变化具有较好的适应性。
  • 它是一个 开源 方法(没有专利问题),常用于实时应用,如机器人视觉和增强现实等。
  • 但是,ORB 在尺度变化上不如 SIFT 和 SURF 强大,对于大范围的尺度变化可能表现较差。

4. FAST (Features from Accelerated Segment Test)

原理:

  • FAST 是一种非常快速的角点检测方法,通过比较像素点与周围像素的亮度差异来判断是否为角点。该方法通过简单的圆形邻域测试,检查是否有连续的像素点比中心点亮度大或小,若满足条件则认为是角点。

效果:

  • FAST 适用于高效的实时应用,但对于不同尺度、旋转和光照变化的鲁棒性较差,通常作为其他算法的辅助部分。

5. HOG (Histogram of Oriented Gradients)

原理:

  • HOG 是一种基于图像梯度方向直方图的特征描述符。通过将图像分为小块(cell),然后计算每个小块内像素的梯度方向和幅值,形成方向直方图,再通过归一化这些直方图,生成图像的描述符。

效果:

  • HOG 对物体检测(尤其是行人检测)效果较好,能够有效描述物体的边缘和形状,适用于静态物体检测。
  • 在旋转和尺度变化方面的鲁棒性较弱,通常需要结合其他方法。

6. BRIEF (Binary Robust Independent Elementary Features)

原理:

  • BRIEF 是一种基于图像局部区域的二进制描述符,它通过在关键点邻域中选择一些像素对,并根据其亮度差异来构造二进制描述符。

效果:

  • BRIEF 的优点是计算非常快速且描述符非常紧凑。
  • 然而,BRIEF 在旋转不变性和尺度不变性方面的表现较弱,通常与其他方法(如 FAST)结合使用。

7. AKAZE (Accelerated KAZE Features)

原理:

  • AKAZE 是一种加速版的 KAZE 特征提取方法,它使用加速的非线性尺度空间来检测特征点。与 SIFT 和 SURF 不同,AKAZE 更关注细节的非线性表示。

效果:

  • AKAZE 在一些低纹理图像上表现较好,比 SIFT 和 SURF 在处理速度上更为高效。
  • 适合对高频信息非常敏感的任务,且具有较好的局部对比度描述能力。

三、对比

四、小结

本文综述了机器学习兴起前主流的图像特征提取方法,包括SIFT、SURF、ORB等7种算法。SIFT具有尺度不变性但计算量大;SURF在保持性能的同时提升了速度;ORB结合FAST和BRIEF实现快速检测;HOG适用于静态物体检测。这些传统方法通过不同技术手段提取图像关键点和描述符,在旋转、尺度、光照变化等方面各具优势,为计算机视觉发展奠定了基础。随着技术进步,这些方法在实时性、精度等方面不断优化,为后续深度学习在图像处理中的应用提供了重要参考。


文章转载自:

http://EdCvMoor.ngzkt.cn
http://ownl4LXg.ngzkt.cn
http://lhfe2t0r.ngzkt.cn
http://VMihGb32.ngzkt.cn
http://Dje4RTq5.ngzkt.cn
http://0MUhtA7J.ngzkt.cn
http://3Utb42UB.ngzkt.cn
http://BDsnoZkC.ngzkt.cn
http://DVKM1Eu8.ngzkt.cn
http://Q2U7iOdd.ngzkt.cn
http://s4GloJo6.ngzkt.cn
http://HcZD96Hy.ngzkt.cn
http://NzXfrkIH.ngzkt.cn
http://FBcIQCMv.ngzkt.cn
http://XjIiHGHg.ngzkt.cn
http://kNENsO6L.ngzkt.cn
http://pgZ48hH8.ngzkt.cn
http://5AXcZeZJ.ngzkt.cn
http://1F6v4buC.ngzkt.cn
http://IQdzx7UK.ngzkt.cn
http://PoGHnrhe.ngzkt.cn
http://91WGO0W3.ngzkt.cn
http://eHhu11Zb.ngzkt.cn
http://flBvPe7Y.ngzkt.cn
http://53yDF9xH.ngzkt.cn
http://vLJiroN9.ngzkt.cn
http://pEhqN7Yf.ngzkt.cn
http://3mG0tuyQ.ngzkt.cn
http://ghjMWmgy.ngzkt.cn
http://9Du3aiG5.ngzkt.cn
http://www.dtcms.com/a/371942.html

相关文章:

  • 软考备考①
  • 信息安全工程师软考攻坚:第三章网络安全技术深度解析与实战训练
  • JDK17日期格式‘MMM’导致九月Sept/Sep格式化异常问题❗❗❗
  • Vulkan 学习(20)---- UniformBuffer 的使用
  • 微信小程序中实现AI对话、生成3D图像并使用xr-frame演示
  • 【不背八股】9.MySQL知识点汇总
  • MySQL6
  • 论文阅读:ICLR 2021 BAG OF TRICKS FOR ADVERSARIAL TRAINING
  • GD32自学笔记:4.ADC
  • LeetCode 522.最长特殊序列2
  • CentOS 7.2 虚机 ssh 登录报错在重启后无法进入系统
  • 腾讯混元 3D 2.0 Windows 便携版:低显存需求下的高效文/图生3D体验
  • 火山 RTC 引擎15 拉流 推流 地址生成器 、合流转推 开关
  • CesiumJS详解:打造专业级Web 3D地球仪与地图的JavaScript库
  • 数据结构:顺序表与链表
  • C++ 前缀和 高频笔试考点 实用技巧 牛客 DP34 [模板] 前缀和 题解 每日一题
  • kotlin - 平板分屏,左右拖动,2个Activity计算宽度,使用ActivityOptions、Rect(三)
  • 【软考架构】第七章 系统架构设计基础知识-7.2基于架构的软件开发方法:Architecture-Based Software Design,ABSD
  • Dify 从入门到精通(第 81/100 篇):Dify 的多模态模型监控(高级篇)
  • 2019年11月系统架构设计师真题及解析摘要
  • 基于Django的“社区爱心养老管理系统”设计与开发(源码+数据库+文档+PPT)
  • IO性能篇(二):文件读写的四种分类
  • 超越模仿,探寻智能的本源:从人类认知机制到下一代自然语言处理
  • 计算机视觉(十二):人工智能、机器学习与深度学习
  • 去中心化投票系统开发教程 第五章:测试与部署
  • 自然语言处理之第一课语言转换方法
  • 移动端代理配置:iOS和Android设备代理设置完全指南
  • 【面试向】区块链介绍
  • 第十四届蓝桥杯青少组C++选拔赛[2023.2.12]第二部分编程题(4、最大空白区)
  • keycloak redirect_url重定向配置