当前位置: 首页 > news >正文

【1】计算机视觉方法(更新)

1 计算机是视觉的定义和任务

计算机视觉(Computer Vision, CV)是人工智能领域的分支,旨在通过算法让计算机从图像或视频中提取信息、理解内容并做出决策。

其核心任务是模拟人类视觉系统,实现场景理解、目标检测、图像分类等功能。

2 传统CV解决问题的步骤和方法

步骤

对图片、视频进行预处理,增强对比度,灰度化,变形等

特征提取,边缘、角点、纹理等

分割,通过阈值进行分割,分别处理

形态学处理,通过膨胀、腐蚀改变图形结构,清楚噪点

目标检测和识别,结合特征描述子和分类器来实现

传统CV擅长

采集视频和图像

对图像、视频预处理

从图像和视频中提取特征

传统CV不擅长

受关照、角度、纹理影响大

鲁棒性差

难以处理复杂的视觉任务

3 OpenCV环境搭建

搭建

可以使用-i 镜像地址

国内的pip源,如下:

阿里云 http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

豆瓣(douban) http://pypi.douban.com/simple/

清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/

中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/

pip install opencv-pythonpip install opencv-contrib-python -i https://pypi.mirrors.ustc.edu.cn/simple/

使用

# 示例1 使用OpenCV打开图片并关闭
import cv2 # 读取
img =cv2.imread('anna.jpg')# 展示体魄
cv2.imshow('image',img)# 等待键盘输入 q 后,关闭图片
while 1:key = cv2.waitKey(0)if key & 0xFF ==ord('q'):cv2.destroyAllWindows()
# 示例2 通过openCV采集图片import cv2cap = cv2.VideoCapture(0)
while cap.isOpened:ret, frame = cap.read()if ret:# 将数据帧保存图片对象cv2.imwrite('frame.jpg', frame)breakcap.release()

4 二值法与实践

目标:简化图形处理难度,将图像转换为黑白两色,通过谁定阈值处理为0和1

过程:

RGB到Gray的过程:解码到RGB的矩阵,乘对用矩阵得到YUV,最后丢弃UV保留Y则是灰度图

灰度图二值化:阈值设置为127,如果像素值>127,则变成255,否则为0

# 示例3 使用openCv进行二值化
import cv2# 读取图片
img = cv2.imread('anna.jpg')
if img is None:print("错误:无法加载图片,请检查文件路径")exit()
# 展示原始图片
cv2.imshow('Original Image', img)# 灰度化
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 展示灰度图
cv2.imshow('Gray Image', gray)# 二值化处理
ret, binary = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
# 展示二值化图
cv2.imshow('binary image', binary)# 等待键盘输入(0表示无限等待)
key = cv2.waitKey(0)
# 无论按下什么键,都关闭所有窗口
cv2.destroyAllWindows()

Blur

目的:对图形做模糊处理,计算机视觉中用于消除噪声

Padding:把0增加到一圈边缘,防止丢失重要信息

Kernel:一般是3*3矩阵扫描原图,乘法求平均

步长:扫描时候移动的格子

均值blur、中值Blur、高斯Blur、双边Blur

# 示例 Blur
import cv2# 读取图片
img = cv2.imread('anna.jpg')# 显示图形
cv2.imshow('Original Image', img)# 转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Blur处理  平均blur
blurred = cv2.blur(gray, (5, 5))# 保留更多边缘  高斯Blur 和双边Blur
# cv2.GaussianBlur(gray, (5, 5), 0) cv2.imshow('blurred Image', blurred)
# 二值化
ret, binary = cv2.threshold(blurred, 137, 255, cv2.THRESH_BINARY)# 显示处理后的图像
# cv2.imshow('Binary Image', binary)cv2.waitKey(0)

使用ROI技术处理图像

特征点及边缘检测

形态学原理与实战

http://www.dtcms.com/a/289429.html

相关文章:

  • Spring Boot 自动装配用法
  • Spring AI 聊天记忆
  • InfluxDB 核心概念与发展历程全景解读(一)
  • 定点小数与分数
  • Laravel 框架NOAUTH Authentication required 错误解决方案-优雅草卓伊凡
  • Leetcode 124. 二叉树中的最大路径和
  • 面向对象基础笔记
  • 提升H7-TOOL自制nRF54L15脱机烧写算法文件速度,1MB程序仅需11秒,并且支持了UICR编程
  • C++23中的std::expected:异常处理
  • 以“融合进化 智领未来”之名,金仓Kingbase FlySync:国产数据库技术的突破与创新
  • SpringBoot集成Skywalking链路跟踪
  • CAN通讯理论与实践:调试和优化全讲解
  • 20250720-2-Kubernetes 调度-资源限制对Pod调度的影响(1)_笔记
  • 基于深度学习的目标检测:从基础到实践
  • 尚庭公寓--------登陆流程介绍以及功能代码
  • 常见的离散积分方法
  • 基于bert-lstm对微博评论的情感分析系统设计与实现
  • 《每日AI-人工智能-编程日报》--2025年7月20日
  • Direct3D 11学习(一)
  • Charles 的 Windows proxy 对爬取瑞数6 网站接口数据的作用分析
  • 高性能架构模式——单服务器高性能模式(PPC与TPC)
  • 创新几何解谜游戏,挑战空间思维极限
  • 【51单片机仿真复位电阻电容参数】2022-5-17
  • TD3与SAC强化学习算法深度对比
  • BLIP、InternVL Series(下)
  • SSH开启Socks5服务
  • 强化学习_Paper_ICLR2024_When Should We Prefer DECISION TRANSFORMERS for offline-RL
  • 【分布式 ID】详解百度 uid-generator(基础篇)
  • java12基础(day12)
  • 零基础学习性能测试第一章-为什么会有性能问题