当前位置: 首页 > news >正文

OCR之行驶证识别

前言

最近和车检行业上的技术过不去了,那就继续分享使用OCR(光学字符识别)提取行驶证上的文字,OCR技术在行驶证识别中的应用已经非常广泛,基于深度学习算法,通过训练大量样本数据,使模型具备图像分类、目标检测和文字识别能力,在行驶证识别中,首先对行驶证图像进行预处理,包括灰度化、二值化、去噪等操作,以提高图像清晰度和识别率,然后对图像中的文字进行定位、分割和识别。

一、开发环境

语言:Pytnon

开发工具:PyCharm

二、本地离线版测试效果

离线版API测试地址:http://47.108.177.251:9000,源码待完善后上传至CSDN,敬请关注~

三、实现方法

一种是使用Tesseract的本地识别(本人用的则是本地离线识别,可部署于任一场景),经过预处理,识别准确度高;另一种是使用百度云API,准确性更高但需要网络调用,若在非互联网下就用不了。

以下是一个使用本地OCR引擎(需要安装Tesseract),这是OpenCV + pytesseract的示例:

import cv2
import pytesseract

def ocr_local(image_path):
    # 读取图像
    img = cv2.imread(image_path)
    
    # 预处理(按需调整)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
    
    # 设置中文识别(需要下载chi_sim训练数据)
    custom_config = r'--oem 3 --psm 6 -l chi_sim'
    text = pytesseract.image_to_string(thresh, config=custom_config)
    
    return text

# 使用示例
print(ocr_local('行驶证照片.jpg'))

如果是想使用 Python 和百度云 OCR API 识别行驶证的示例代码,需要先注册百度AI开放平台获取API Key:

from aip import AipOcr

# 配置百度OCR应用信息
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

def ocr_vehicle_license(image_path):
    # 读取图片
    with open(image_path, 'rb') as f:
        image = f.read()
    
    # 调用行驶证识别接口
    result = client.vehicleLicense(image)
    
    # 解析结果
    if 'words_result' in result:
        data = {}
        for key, value in result['words_result'].items():
            data[key] = value['words']
        return data
    else:
        return None

# 使用示例
if __name__ == '__main__':
    image_path = '行驶证照片.jpg'
    result = ocr_vehicle_license(image_path)
    
    if result:
        print("识别结果:")
        print(f"车牌号码: {result.get('plate_num', '')}")
        print(f"车辆类型: {result.get('vehicle_type', '')}")
        print(f"所有人: {result.get('owner', '')}")
        print(f"住址: {result.get('address', '')}")
        print(f"使用性质: {result.get('use_character', '')}")
    else:
        print("识别失败")

注意:

  1. 百度API版本需要网络

  2. 本地版需要安装Tesseract并下载中文语言包(应用场景更广泛)

  3. 实际应用中需要根据行驶证版式添加图像预处理和结果解析逻辑

http://www.dtcms.com/a/122462.html

相关文章:

  • 【MySQL】——详解事务
  • 多账户使用Github的场景,设置 SSH 多账号使用特定 key
  • MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题
  • Pytorch查看神经网络结构和参数量
  • MongoDB 新手笔记
  • GitHub优秀项目:数据湖的管理系统LakeFS
  • 42、JavaEE高级主题:WebSocket详解
  • linux入门四:Linux 编译器
  • leetcode_面试题 02.07. 链表相交_java
  • Interactron: Embodied Adaptive Object Detection(训练时进行更新参数) 还没看懂
  • 金融数据分析(Python)个人学习笔记(7):网络数据采集以及FNN分类
  • React八案例上
  • Seq2Seq - 编码器(Encoder)和解码器(Decoder)
  • Linux系统安全及应用
  • Spring AI Alibaba MCP 市场正式上线!
  • spark安装过程问题
  • CSS 定位属性的生动比喻:以排队为例理解 relative 与 absolute
  • HP EVA SAN 的基础知识及常见数据丢失问题
  • 【nnUNetv2进阶】二十九、nnUNetv2 魔改网络-小试牛刀-引入RCM(Rectangular Self-Calibration Module)
  • Mybatis操作数据库
  • 8. git branch
  • spring mvc 异常处理中@RestControllerAdvice 和 @ControllerAdvice 对比详解
  • Linux服务器——Samba服务器
  • 【C++编程基础-关键字】:constexpr和const
  • Vue3服务端渲染实战:Nuxt3深度解析与高性能SSR架构设计
  • vLLM实战:多机多卡大模型分布式推理部署全流程指南
  • 深入探究Python的re模块及其在爬虫中的应用
  • 界面控件DevExpress WPF v25.1新功能预览 - 数据网格、报表性能增强
  • [特殊字符] Hyperlane:Rust 高性能 HTTP 服务器库,开启 Web 服务新纪元!
  • ARM裸机全集学习笔记【链接来源:向阳而生,逆风翻盘】