当前位置: 首页 > news >正文

opencv实际应用--银行卡号识别

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,主要用于图像和视频处理、目标检测、特征提取、3D重建以及机器学习任务。它支持多种编程语言(如C++、Python),提供丰富的算法和工具,可用于人脸识别、物体检测、运动跟踪、图像增强等应用,广泛应用于工业检测、自动驾驶、安防监控、医疗影像等领域。其高效性和跨平台特性使其成为计算机视觉开发的核心工具之一。在日常生活中,我们可以通过opencv来识别银行卡卡号,实现银行卡的分类。

以下是我们用来识别检测的银行卡图片

以及用于模板处理的模板图片

以下是代码实现

import numpy as np
import argparse
import cv2
import myutils

#设置参数
ap=argparse.ArgumentParser()
ap.add_argument('-i','--image',required=True,help='path to iuput image')
ap.add_argument('-t','--template',required=True,help='path to template OCR-A image')
#vars(ap.parse_args()):解析命令行参数并将其转换为字典形式
args=vars(ap.parse_args())


FIRST_NUMBER={
    '3':'American',
    '4':'Visa',
    '5':'MasterCard',
    '6':'Discover'
}


def cv_show(name,image):
    cv2.imshow(name,image)
    cv2.waitKey(0)


a=args['template']

'''--------模板图像中数字的定位处理-----------'''
img=cv2.imread(args['template'])
cv_show('img',img)

ref=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
cv_show('ref',ref)
#cv2.threshold():对灰度图像进行阈值处理,将其转换为二值图像,cv2.THRESH_BINARY_INV 表示反二进制阈值。
ref=cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]
cv_show('ref',ref)
#查找并排序模板图像中的轮廓
_,refCnts,hierarchy=cv2.findContours(ref,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cv2.drawContours(img,refCnts,-1,(0,255,0),3)

cv_show('img',img)
#myutils.sort_contours():对轮廓进行从左到右的排序。
refCnts=myutils.sort_contours(refCnts,method='left-to-right')[0]

digits={}
#遍历排序后的轮廓,提取每个数字的 ROI(感兴趣区域),并将其调整为固定大小(57x88),存储在字典 digits 中,键为数字的索引。
#enumerate() 是 Python 中的一个内置函数
# 它的作用是 为可迭代对象添加索引,使得在遍历时可以同时访问索引和元素。
for (i,c) in enumerate(refCnts):
    (x,y,w,h)=cv2.boundingRect(c)

    roi=ref[y:y+h,x:x+w]

    roi=cv2.resize(roi,(57, 88))

    cv_show('ro',roi)

    digits[i]=roi
print(digits)

'''----------信用卡的图像处理---------------------'''
#信用卡信息处理

image=cv2.imread(args['image'])
image=myutils.resize(image,width=300)
cv_show('image',image)
gray=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv_show('gray',gray)

#初始化卷积核
rectKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(9,3))
sqKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(5,5))

#顶帽操作
tophat=cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel)
cv_show('tophat',tophat)


#-----找到数字边框---------
# 1、通过闭操作(先膨胀,再腐蚀)将数字连在一起
closeX=cv2.morphologyEx(tophat,cv2.MORPH_CLOSE,rectKernel)
cv_show('closeX',closeX)
#THRESH_OTSU会自动寻找到合适的阈值,适合双峰,需要把阈值参数设置为0
thresh=cv2.threshold(closeX,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
# 再来一个闭操作
# thresh1=cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel)
# cv_show('thresh1',thresh1)

#计算轮廓
_,threshCnts,h=cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts=threshCnts
cur_img=image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,255,0),3)
cv_show('cur_img',cur_img)

#遍历轮廓,找到数字部分像素区域
locs=[]
for (i,c) in enumerate(cnts):
    (x,y,w,h)=cv2.boundingRect(c)#计算外接矩形
    ar=w/float(h)
    #选择合适区域
    if ar>2.5 and ar<4.0:
        if (w>40 and w<55) and (h>10 and h<20):
            locs.append((x,y,w,h))

#将轮廓从左到右排序
locs=sorted(locs,key=lambda x:x[0])

output=[]

for (i,(gX,gY,gW,gH)) in enumerate(locs):
    groupOutput=[]
    group=gray[gY-5:gY+gH+5,gX-5:gX+gW+5]

    cv_show('group',group)

    group=cv2.threshold(group,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

    cv_show('group',group)

    group_,digitCnts,hierarchy=cv2.findContours(group.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

    digitCnts=myutils.sort_contours(digitCnts,method='left-to-right')[0]

    for c in digitCnts:

        (x,y,w,h)=cv2.boundingRect(c)

        roi=group[y:y+h,x:x+w]

        roi=cv2.resize(roi,(57,88))
        cv_show('roi',roi)

        #使用模块匹配,计算匹配得分

        scores=[]
        ##在模板中计算每一个得分
        #digits 是一个字典
        #digits.items() 方法会返回一个包含字典中所有键值对的可迭代对象,其中每个元素是一个元组,元组的第一个元素是键,第二个元素是对应的值。
        for (digit,digitROI) in digits.items():
            ## 模板匹配
            #cv2.matchTemplate此函数用于在一幅图像里查找与给定模板最匹配的区域
            # roi:代表输入图像,也就是要在其中查找模板的图像。
            # digitROI:代表模板图像,也就是你想要在输入图像中查找的部分。
            # cv2.TM_CCOEFF:表示匹配方法,这里采用的是相关性系数匹配法。
            #函数会返回一个二维的 NumPy 数组
            result=cv2.matchTemplate(roi,digitROI,cv2.TM_CCOEFF)
            #cv2.minMaxLoc 函数用于在一个单通道的矩阵(通常是图像或模板匹配结果)中查找最小值、最大值以及它们对应的位置。
            #该函数返回一个包含四个值的元组,依次为:
            # 矩阵中的最小值。
            # 矩阵中的最大值。
            # 最小值所在的位置(以元组 (x, y) 形式表示)。
            # 最大值所在的位置(以元组 (x, y) 形式表示)
            (_,score,_,_)=cv2.minMaxLoc(result)

            scores.append(score)
        #np.argmax 用于返回数组中最大值所在的索引。
        #例如,如果 scores = [1, 5, 3],那么 np.argmax(scores) 会返回 1,
        #str 是 Python 内置函数,用于将一个对象转换为字符串类型。
        groupOutput.append(str(np.argmax(scores)))

    # 画出来
    cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),1)
    # cv2.putText()是OpenCV库中的一个函数,用于在图像上添加文本。
    cv2.putText(image,''.join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)

    output.extend(groupOutput)

print('Credit Card Type:{}'.format(FIRST_NUMBER[output[0]]))
print('Credit Card#:{}'.format(''.join(output)))

cv2.imshow('image',image)
cv2.waitKey(0)

打印输出结果如下图所示

相关文章:

  • 探秘数据库连接池:HikariCP与Tomcat JDBC
  • Allpairs工具下载及操作流程(联动Deepseek)
  • Deepseek Bart模型相比Bert的优势
  • 生成与强化学习:赋予VLA系统物理行动能力
  • 定时器介绍及简单应用
  • 双Token实现用户登录身份认证-Java版
  • numpy练习
  • kubernetes常见Pod状态
  • 八股面经【2025/4/13】
  • 《算法导论》Ch.17_学习笔记
  • L1-6 大勾股定理
  • CST1018.基于Spring Boot+Vue滑雪场管理系统
  • 经典SQL练习题50道
  • 【数字图像处理】机器视觉基础
  • 分布式日志治理:Log4j2自定义Appender写日志到RocketMQ
  • YOLO V8的​​Anchor-Free​​、​​解耦头(Decoupled Head)、损失函数定义(含​​Varifocal Loss)
  • android display 笔记(十一)surfaceflinger 如何将图层传到lcd驱动的呢?
  • 指针入门C++
  • wkhtmltopdf 实现批量对网页转为图片的好工具,快速实现大量卡片制作
  • 数学建模学习资料免费分享:历年赛题与优秀论文、算法课程、数学软件等
  • 市场监管总局召开平台企业支持个体工商户发展座谈会
  • 台行政机构网站删除“汉人”改为“其余人口”,国台办回应
  • 中国至越南河内国际道路运输线路正式开通
  • 上海145家博物馆、73家美术馆将减免费开放
  • 中美是否计划讨论美方以芬太尼为由对华征收的特别关税?外交部回应
  • 广州一饮品店取名“警茶”?市监局:取名没问题,但图像会产生误解