当前位置：首页 > news >正文

opencv实际应用--银行卡号识别

news 2025/7/3 9:56:18

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉库，主要用于图像和视频处理、目标检测、特征提取、3D重建以及机器学习任务。它支持多种编程语言（如C++、Python），提供丰富的算法和工具，可用于人脸识别、物体检测、运动跟踪、图像增强等应用，广泛应用于工业检测、自动驾驶、安防监控、医疗影像等领域。其高效性和跨平台特性使其成为计算机视觉开发的核心工具之一。在日常生活中，我们可以通过opencv来识别银行卡卡号，实现银行卡的分类。

以下是我们用来识别检测的银行卡图片

以及用于模板处理的模板图片

以下是代码实现

import numpy as np
import argparse
import cv2
import myutils

#设置参数
ap=argparse.ArgumentParser()
ap.add_argument('-i','--image',required=True,help='path to iuput image')
ap.add_argument('-t','--template',required=True,help='path to template OCR-A image')
#vars(ap.parse_args())：解析命令行参数并将其转换为字典形式
args=vars(ap.parse_args())


FIRST_NUMBER={
    '3':'American',
    '4':'Visa',
    '5':'MasterCard',
    '6':'Discover'
}


def cv_show(name,image):
    cv2.imshow(name,image)
    cv2.waitKey(0)


a=args['template']

'''--------模板图像中数字的定位处理-----------'''
img=cv2.imread(args['template'])
cv_show('img',img)

ref=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
cv_show('ref',ref)
#cv2.threshold()：对灰度图像进行阈值处理，将其转换为二值图像，cv2.THRESH_BINARY_INV 表示反二进制阈值。
ref=cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]
cv_show('ref',ref)
#查找并排序模板图像中的轮廓
_,refCnts,hierarchy=cv2.findContours(ref,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cv2.drawContours(img,refCnts,-1,(0,255,0),3)

cv_show('img',img)
#myutils.sort_contours()：对轮廓进行从左到右的排序。
refCnts=myutils.sort_contours(refCnts,method='left-to-right')[0]

digits={}
#遍历排序后的轮廓，提取每个数字的 ROI（感兴趣区域），并将其调整为固定大小（57x88），存储在字典 digits 中，键为数字的索引。
#enumerate() 是 Python 中的一个内置函数
# 它的作用是 为可迭代对象添加索引，使得在遍历时可以同时访问索引和元素。
for (i,c) in enumerate(refCnts):
    (x,y,w,h)=cv2.boundingRect(c)

    roi=ref[y:y+h,x:x+w]

    roi=cv2.resize(roi,(57, 88))

    cv_show('ro',roi)

    digits[i]=roi
print(digits)

'''----------信用卡的图像处理---------------------'''
#信用卡信息处理

image=cv2.imread(args['image'])
image=myutils.resize(image,width=300)
cv_show('image',image)
gray=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv_show('gray',gray)

#初始化卷积核
rectKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(9,3))
sqKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(5,5))

#顶帽操作
tophat=cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel)
cv_show('tophat',tophat)


#-----找到数字边框---------
# 1、通过闭操作（先膨胀，再腐蚀）将数字连在一起
closeX=cv2.morphologyEx(tophat,cv2.MORPH_CLOSE,rectKernel)
cv_show('closeX',closeX)
#THRESH_OTSU会自动寻找到合适的阈值，适合双峰，需要把阈值参数设置为0
thresh=cv2.threshold(closeX,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
# 再来一个闭操作
# thresh1=cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel)
# cv_show('thresh1',thresh1)

#计算轮廓
_,threshCnts,h=cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts=threshCnts
cur_img=image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,255,0),3)
cv_show('cur_img',cur_img)

#遍历轮廓，找到数字部分像素区域
locs=[]
for (i,c) in enumerate(cnts):
    (x,y,w,h)=cv2.boundingRect(c)#计算外接矩形
    ar=w/float(h)
    #选择合适区域
    if ar>2.5 and ar<4.0:
        if (w>40 and w<55) and (h>10 and h<20):
            locs.append((x,y,w,h))

#将轮廓从左到右排序
locs=sorted(locs,key=lambda x:x[0])

output=[]

for (i,(gX,gY,gW,gH)) in enumerate(locs):
    groupOutput=[]
    group=gray[gY-5:gY+gH+5,gX-5:gX+gW+5]

    cv_show('group',group)

    group=cv2.threshold(group,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

    cv_show('group',group)

    group_,digitCnts,hierarchy=cv2.findContours(group.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

    digitCnts=myutils.sort_contours(digitCnts,method='left-to-right')[0]

    for c in digitCnts:

        (x,y,w,h)=cv2.boundingRect(c)

        roi=group[y:y+h,x:x+w]

        roi=cv2.resize(roi,(57,88))
        cv_show('roi',roi)

        #使用模块匹配，计算匹配得分

        scores=[]
        ##在模板中计算每一个得分
        #digits 是一个字典
        #digits.items() 方法会返回一个包含字典中所有键值对的可迭代对象，其中每个元素是一个元组，元组的第一个元素是键，第二个元素是对应的值。
        for (digit,digitROI) in digits.items():
            ## 模板匹配
            #cv2.matchTemplate此函数用于在一幅图像里查找与给定模板最匹配的区域
            # roi：代表输入图像，也就是要在其中查找模板的图像。
            # digitROI：代表模板图像，也就是你想要在输入图像中查找的部分。
            # cv2.TM_CCOEFF：表示匹配方法，这里采用的是相关性系数匹配法。
            #函数会返回一个二维的 NumPy 数组
            result=cv2.matchTemplate(roi,digitROI,cv2.TM_CCOEFF)
            #cv2.minMaxLoc 函数用于在一个单通道的矩阵（通常是图像或模板匹配结果）中查找最小值、最大值以及它们对应的位置。
            #该函数返回一个包含四个值的元组，依次为：
            # 矩阵中的最小值。
            # 矩阵中的最大值。
            # 最小值所在的位置（以元组 (x, y) 形式表示）。
            # 最大值所在的位置（以元组 (x, y) 形式表示）
            (_,score,_,_)=cv2.minMaxLoc(result)

            scores.append(score)
        #np.argmax 用于返回数组中最大值所在的索引。
        #例如，如果 scores = [1, 5, 3]，那么 np.argmax(scores) 会返回 1，
        #str 是 Python 内置函数，用于将一个对象转换为字符串类型。
        groupOutput.append(str(np.argmax(scores)))

    # 画出来
    cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),1)
    # cv2.putText()是OpenCV库中的一个函数，用于在图像上添加文本。
    cv2.putText(image,''.join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)

    output.extend(groupOutput)

print('Credit Card Type:{}'.format(FIRST_NUMBER[output[0]]))
print('Credit Card#:{}'.format(''.join(output)))

cv2.imshow('image',image)
cv2.waitKey(0)

打印输出结果如下图所示