当前位置: 首页 > news >正文

OpenCV学习(二)-二维、三维识别

OpenCV 是一个功能强大的计算机视觉库,可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。


1. 二维图像识别

二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作:

1.1 图像分类

使用预训练模型对图像进行分类,例如使用深度学习模型(如 ResNet、MobileNet 等)。

import cv2# 加载预训练的深度学习模型
net = cv2.dnn.readNetFromCaffe("deploy.prototxt", "resnet.caffemodel")# 读取图像并预处理
image = cv2.imread("image.jpg")
blob = cv2.dnn.blobFromImage(image, scalefactor=1.0, size=(224, 224), mean=(104, 117, 123))# 输入模型并进行推理
net.setInput(blob)
out = net.forward()# 输出结果
print("预测结果:", out)
1.2 对象检测

使用目标检测模型(如 YOLO、SSD)来检测图像中的对象。

import cv2# 加载模型
net = cv2.dnn.readNetFromDarknet("yolov3.cfg", "yolov3.weights")# 读取图像
image = cv2.imread("image.jpg")
height, width = image.shape[:2]# 预处理图像
blob = cv2.dnn.blobFromImage(image, 1/255.0, (416, 416), swapRB=True, crop=False)
net.setInput(blob)# 推理
layer_names = net.getLayerNames()
output_layers = [layer_names[i - 1] for i in net.getUnconnectedOutLayers()]
outputs = net.forward(output_layers)# 解析结果并绘制检测框
for output in outputs:for detection in output:scores = detection[5:]class_id = np.argmax(scores)confidence = scores[class_id]if confidence > 0.5:center_x = int(detection[0] * width)center_y = int(detection[1] * height)w = int(detection[2] * width)h = int(detection[3] * height)x = int(center_x - w / 2)y = int(center_y - h / 2)cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)# 显示结果
cv2.imshow("Detection", image)
cv2.waitKey(0)
1.3 特征提取

使用特征提取算法(如 SIFT、ORB)提取图像中的关键点。

import cv2# 读取图像
image = cv2.imread("image.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 创建 SIFT 检测器
sift = cv2.SIFT_create()
keypoints, descriptors = sift.detectAndCompute(gray, None)# 绘制关键点
image_with_keypoints = cv2.drawKeypoints(image, keypoints, None)
cv2.imshow("Keypoints", image_with_keypoints)
cv2.waitKey(0)

2. 三维图像识别

OpenCV 本身对三维图像的支持有限,通常需要结合其他库(如 PCL、Open3D)进行三维图像处理。以下是一些基本概念和示例:

2.1 点云处理

点云是三维图像的一种常见表示形式,通常包含三维坐标、颜色等信息。

import open3d as o3d# 读取点云文件
pcd = o3d.io.read_point_cloud("point_cloud.ply")# 可视化点云
o3d.visualization.draw_geometries([pcd])
2.2 三维重建

三维重建是通过多视角图像生成三维模型,通常需要使用深度相机(如 Kinect)或立体相机。

import cv2
import numpy as np# 模拟深度图像
depth_image = np.random.rand(480, 640).astype(np.float32)# 转换为点云
fx, fy = 525.0, 525.0  # 相机内参
cx, cy = 319.5, 239.5points = []
for y in range(depth_image.shape[0]):for x in range(depth_image.shape[1]):z = depth_image[y, x]if z == 0:continuepoint = [(x - cx) * z / fx, (y - cy) * z / fy, z]points.append(point)# 使用 Open3D 可视化
pcd = o3d.geometry.PointCloud()
pcd.points = o3d.utility.Vector3dVector(points)
o3d.visualization.draw_geometries([pcd])
2.3 三维特征提取

三维特征提取通常包括法线估计、关键点检测等。

import open3d as o3d# 读取点云
pcd = o3d.io.read_point_cloud("point_cloud.ply")# 估计法线
pcd.estimate_normals(search_param=o3d.geometry.KDTreeSearchParamHybrid(radius=0.1, max_nn=30))# 可视化法线
o3d.visualization.draw_geometries([pcd], point_show_normal=True)

3. 总结

  • 二维图像识别:使用 OpenCV 提供的深度学习模型和特征提取算法,可以实现图像分类、对象检测、特征提取等任务。
  • 三维图像识别:OpenCV 本身对三维图像的支持有限,通常需要结合其他库(如 Open3D、PCL)进行点云处理、三维重建和特征提取。
http://www.dtcms.com/a/290280.html

相关文章:

  • 技术演进中的开发沉思-41 MFC系列:定制 AppWizard
  • 【爬虫】06 - 自动化爬虫selenium
  • Zabbix 企业级分布式监控系统深度解析
  • 计算机发展史:人工智能时代的智能变革与无限可能
  • Laravel 后台登录 403 Forbidden 错误深度解决方案-优雅草卓伊凡|泡泡龙
  • NVM的安装使用:nvm管理多个 Node.js 版本的工具
  • gRPC深度解析:原理、实践与性能优化指南
  • 将 RustFS 用作 GitLab 对象存储后端
  • uniapp使用uni-ui怎么修改默认的css样式比如多选框及样式覆盖小程序/安卓/ios兼容问题
  • 测量误差溯源:系统误差与随机误差的数学建模与分离方法
  • 大模型——Prompt 优化还是模型微调
  • 【PTA数据结构 | C语言版】求单源最短路的Dijkstra算法
  • AI学习--本地部署ollama
  • 6.String、StringBuffer、StringBuilder区别及使用场景
  • 第3章通用的服务可用性治理手段——3.1 微服务架构与网络调用
  • Tomcat的部署、单体架构、session会话、spring
  • ARC学习(6)arc 编译器overlap 地址重叠方式使用
  • stm32mp157f-dk2安装镜像并且部署qt全流程
  • 基于uniapp的餐厅在线选餐小程序的设计与实现
  • 信息整合注意力IIA,通过双方向的轻量级注意力机制强化目标关键特征并抑制噪声,提升特征融合的有效性和空间位置信息的保留能力。
  • Qt的QAbstractTableModel
  • 基于大数据的旅游推荐系统 Python+Django+Hive+Vue.js
  • 三大工厂设计模式
  • 电商项目_秒杀_初步分析
  • Django视图与路由系统
  • Jetpack ViewModel LiveData:现代Android架构组件的核心力量
  • echarts图铺满父元素
  • 在翻译语义相似度和会议摘要相似度评估任务中 ,分类任务 回归任务 生成任务区别
  • k8s查看某个pod的svc
  • Zookeeper 注册中心垂直介入