当前位置: 首页 > news >正文

认知篇#11:计算机视觉研究领域的大致分类

一、概述

计算机视觉是一门研究如何让机器“看见”并“理解”数字图像或视频的科学。它旨在通过算法和模型,自动地从视觉数据中提取、分析和处理信息,从而感知环境、识别物体、跟踪运动、重建三维场景等。其最终目标是赋予机器像人类一样的视觉感知能力,让计算机能自动“看懂”世界,并应用于自动驾驶、医疗影像、安防监控、工业检测和增强现实等众多领域

二、分类

大体上讲,计算机视觉所研究的对象可以分为两类。第一是语义感知,第二是几何属性

语义感知是目前研究最为广泛的领域,其中包括这不少于六个研究方向。包括分类(classification)、检测(detection)、识别(recognition)、分割(segmentation)、检索(retrieval)、语言(language)。

1、分类(classification)

视觉模型执行分类任务的对象通常是物体,简单说就是将图像中的主要元素进行分类。

2、检测(detection)

检测任务不仅需要分类,还需要进行多个目标的检测,并分别输出它们的置信度。

3、识别(recognition)

识别任务更加精确,需要区分同一种物体的细节不同,例如人脸识别、指纹识别等等。

4、分割(segmentation)

分割是指将目标物体从图像中“扣”出来。

5、检索(retrieval)

检索主要包括以文搜图、以图搜图等形式。

6、语言(language)

语言需要解决的是模型对图片的理解能力,进行问答或者语言描述。

三、可视化

四、总结

文章重点将其研究内容分为语义感知几何属性两大类,并详细介绍了语义感知的六个核心任务:分类、检测、识别、分割、检索和基于图像的语言理解,清晰地勾勒出了该领域的技术框架。


文章转载自:

http://sYB3Z0lx.tntqr.cn
http://HgQkEbOf.tntqr.cn
http://z3XtVmgP.tntqr.cn
http://JdloeYNd.tntqr.cn
http://wAapfB1f.tntqr.cn
http://ffu04iiI.tntqr.cn
http://tO2e9HEU.tntqr.cn
http://uOPGUxMX.tntqr.cn
http://52tICU56.tntqr.cn
http://TQg4QoPa.tntqr.cn
http://2xr1GkG1.tntqr.cn
http://rpH1FmPj.tntqr.cn
http://rjpogczt.tntqr.cn
http://zLngpXsQ.tntqr.cn
http://DPXVrzTO.tntqr.cn
http://4Yd0eN2U.tntqr.cn
http://zLZkxJPA.tntqr.cn
http://ZJw0T9yz.tntqr.cn
http://2Tl7XJdu.tntqr.cn
http://SW82VoD0.tntqr.cn
http://LAYWqJWQ.tntqr.cn
http://Z59V6UVO.tntqr.cn
http://KD4gMQ2I.tntqr.cn
http://QbUs8681.tntqr.cn
http://5fp6wwiJ.tntqr.cn
http://55heYXNO.tntqr.cn
http://YPXci32e.tntqr.cn
http://3E9nBzii.tntqr.cn
http://Q5z2nydB.tntqr.cn
http://TNIE76Zi.tntqr.cn
http://www.dtcms.com/a/369593.html

相关文章:

  • 如何高效比对不同合同版本差异,避免法律风险?
  • 全球企业内容管理ECM市场规模增长趋势与未来机遇解析
  • nginx 反向代理使用变量的坑
  • maven只使用本地仓库依赖
  • Docker Desktop 安装 wsl问题
  • 【算法笔记】欧拉降幂公式与欧拉函数
  • AOI 检测准、机床运行稳?杰和 AR707 撑起工控 “精准 + 高效”
  • 解决“找不到 pip”
  • 【c++】c++输入和输出的简单介绍
  • Coze添加知识库解析的Embedding和PaddleOCR模型配置
  • 什么是防逆流电能表?深度解析如何实现防逆流
  • 孙宇晨钱包被列入黑名单,WLFI代币价格暴跌引发中心化争议
  • 第七章 Cesium 3D 粒子烟花效果案例解析:从原理到完整代码
  • 【110】基于51单片机金属探测器【Proteus仿真+Keil程序+报告+原理图】
  • (双指针)LeetCode 209 长度最小的子数组+3 无重复字符的最长子串
  • 技术面:Java并发(线程池、ForkJoinPool)
  • 2026秋招Leetcode刷题记录
  • 探讨Xsens在人形机器人研发中的四个核心应用
  • [特殊字符] 香蕉超市|Nano Bananary|ZHO|已开源
  • 一种基于注解与AOP的Spring Boot接口限流防刷方案
  • 新启航开启深孔测量新纪元:激光频率梳技术攻克光学遮挡,达 130mm 深度 2μm 精度
  • ZyperWin++一个超好用的工具
  • 共用体与枚举:C++高效内存技巧
  • Semi-Supervised 3-D Medical
  • 解决网络太慢问题
  • IP5326_BZ 支持C同口输入输出的移动电源芯片 2.4A的充放电电流 支持4LED指示灯
  • 如何通过 Gitee API 上传文件到指定仓库
  • 商密保护密码:非公知性鉴定的攻防之道
  • 从零到上线:Docker、Docker Compose 与 Runtime 安装部署全指南(含实战示例与应用场景)
  • 2025 年 8 个最佳网站内容管理系统(CMS)