当前位置：首页 > news >正文

认知篇#11：计算机视觉研究领域的大致分类

news 2025/9/6 15:34:28

一、概述

计算机视觉是一门研究如何让机器“看见”并“理解”数字图像或视频的科学。它旨在通过算法和模型，自动地从视觉数据中提取、分析和处理信息，从而感知环境、识别物体、跟踪运动、重建三维场景等。其最终目标是赋予机器像人类一样的视觉感知能力，让计算机能自动“看懂”世界，并应用于自动驾驶、医疗影像、安防监控、工业检测和增强现实等众多领域

二、分类

大体上讲，计算机视觉所研究的对象可以分为两类。第一是语义感知，第二是几何属性。

语义感知是目前研究最为广泛的领域，其中包括这不少于六个研究方向。包括分类（classification）、检测（detection）、识别（recognition）、分割（segmentation）、检索（retrieval）、语言（language）。

1、分类（classification）

视觉模型执行分类任务的对象通常是物体，简单说就是将图像中的主要元素进行分类。

2、检测（detection）

检测任务不仅需要分类，还需要进行多个目标的检测，并分别输出它们的置信度。

3、识别（recognition）

识别任务更加精确，需要区分同一种物体的细节不同，例如人脸识别、指纹识别等等。

4、分割（segmentation）

分割是指将目标物体从图像中“扣”出来。

5、检索（retrieval）

检索主要包括以文搜图、以图搜图等形式。

6、语言（language）

语言需要解决的是模型对图片的理解能力，进行问答或者语言描述。

三、可视化

四、总结

文章重点将其研究内容分为语义感知和几何属性两大类，并详细介绍了语义感知的六个核心任务：分类、检测、识别、分割、检索和基于图像的语言理解，清晰地勾勒出了该领域的技术框架。

文章转载自：

http://sYB3Z0lx.tntqr.cn
http://HgQkEbOf.tntqr.cn
http://z3XtVmgP.tntqr.cn
http://JdloeYNd.tntqr.cn
http://wAapfB1f.tntqr.cn
http://ffu04iiI.tntqr.cn
http://tO2e9HEU.tntqr.cn
http://uOPGUxMX.tntqr.cn
http://52tICU56.tntqr.cn
http://TQg4QoPa.tntqr.cn
http://2xr1GkG1.tntqr.cn
http://rpH1FmPj.tntqr.cn
http://rjpogczt.tntqr.cn
http://zLngpXsQ.tntqr.cn
http://DPXVrzTO.tntqr.cn
http://4Yd0eN2U.tntqr.cn
http://zLZkxJPA.tntqr.cn
http://ZJw0T9yz.tntqr.cn
http://2Tl7XJdu.tntqr.cn
http://SW82VoD0.tntqr.cn
http://LAYWqJWQ.tntqr.cn
http://Z59V6UVO.tntqr.cn
http://KD4gMQ2I.tntqr.cn
http://QbUs8681.tntqr.cn
http://5fp6wwiJ.tntqr.cn
http://55heYXNO.tntqr.cn
http://YPXci32e.tntqr.cn
http://3E9nBzii.tntqr.cn
http://Q5z2nydB.tntqr.cn
http://TNIE76Zi.tntqr.cn

http://www.dtcms.com/a/369593.html

相关文章：

如何高效比对不同合同版本差异，避免法律风险？

全球企业内容管理ECM市场规模增长趋势与未来机遇解析

nginx 反向代理使用变量的坑

maven只使用本地仓库依赖

Docker Desktop 安装 wsl问题

【算法笔记】欧拉降幂公式与欧拉函数

AOI 检测准、机床运行稳？杰和 AR707 撑起工控 “精准 + 高效”

解决“找不到 pip”

【c++】c++输入和输出的简单介绍

Coze添加知识库解析的Embedding和PaddleOCR模型配置

什么是防逆流电能表？深度解析如何实现防逆流

孙宇晨钱包被列入黑名单，WLFI代币价格暴跌引发中心化争议

第七章 Cesium 3D 粒子烟花效果案例解析：从原理到完整代码

【110】基于51单片机金属探测器【Proteus仿真+Keil程序+报告+原理图】

(双指针）LeetCode 209 长度最小的子数组+3 无重复字符的最长子串

技术面：Java并发（线程池、ForkJoinPool）

2026秋招Leetcode刷题记录

探讨Xsens在人形机器人研发中的四个核心应用

[特殊字符] 香蕉超市｜Nano Bananary｜ZHO｜已开源

一种基于注解与AOP的Spring Boot接口限流防刷方案

新启航开启深孔测量新纪元：激光频率梳技术攻克光学遮挡，达 130mm 深度 2μm 精度

ZyperWin++一个超好用的工具

共用体与枚举：C++高效内存技巧

Semi-Supervised 3-D Medical

解决网络太慢问题

IP5326_BZ 支持C同口输入输出的移动电源芯片 2.4A的充放电电流支持4LED指示灯

如何通过 Gitee API 上传文件到指定仓库

商密保护密码：非公知性鉴定的攻防之道

从零到上线：Docker、Docker Compose 与 Runtime 安装部署全指南（含实战示例与应用场景）

2025 年 8 个最佳网站内容管理系统（CMS）