opencv实际应用--银行卡号识别
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,主要用于图像和视频处理、目标检测、特征提取、3D重建以及机器学习任务。它支持多种编程语言(如C++、Python),提供丰富的算法和工具,可用于人脸识别、物体检测、运动跟踪、图像增强等应用,广泛应用于工业检测、自动驾驶、安防监控、医疗影像等领域。其高效性和跨平台特性使其成为计算机视觉开发的核心工具之一。在日常生活中,我们可以通过opencv来识别银行卡卡号,实现银行卡的分类。
以下是我们用来识别检测的银行卡图片
以及用于模板处理的模板图片
以下是代码实现
import numpy as np
import argparse
import cv2
import myutils
#设置参数
ap=argparse.ArgumentParser()
ap.add_argument('-i','--image',required=True,help='path to iuput image')
ap.add_argument('-t','--template',required=True,help='path to template OCR-A image')
#vars(ap.parse_args()):解析命令行参数并将其转换为字典形式
args=vars(ap.parse_args())
FIRST_NUMBER={
'3':'American',
'4':'Visa',
'5':'MasterCard',
'6':'Discover'
}
def cv_show(name,image):
cv2.imshow(name,image)
cv2.waitKey(0)
a=args['template']
'''--------模板图像中数字的定位处理-----------'''
img=cv2.imread(args['template'])
cv_show('img',img)
ref=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
cv_show('ref',ref)
#cv2.threshold():对灰度图像进行阈值处理,将其转换为二值图像,cv2.THRESH_BINARY_INV 表示反二进制阈值。
ref=cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]
cv_show('ref',ref)
#查找并排序模板图像中的轮廓
_,refCnts,hierarchy=cv2.findContours(ref,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cv2.drawContours(img,refCnts,-1,(0,255,0),3)
cv_show('img',img)
#myutils.sort_contours():对轮廓进行从左到右的排序。
refCnts=myutils.sort_contours(refCnts,method='left-to-right')[0]
digits={}
#遍历排序后的轮廓,提取每个数字的 ROI(感兴趣区域),并将其调整为固定大小(57x88),存储在字典 digits 中,键为数字的索引。
#enumerate() 是 Python 中的一个内置函数
# 它的作用是 为可迭代对象添加索引,使得在遍历时可以同时访问索引和元素。
for (i,c) in enumerate(refCnts):
(x,y,w,h)=cv2.boundingRect(c)
roi=ref[y:y+h,x:x+w]
roi=cv2.resize(roi,(57, 88))
cv_show('ro',roi)
digits[i]=roi
print(digits)
'''----------信用卡的图像处理---------------------'''
#信用卡信息处理
image=cv2.imread(args['image'])
image=myutils.resize(image,width=300)
cv_show('image',image)
gray=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv_show('gray',gray)
#初始化卷积核
rectKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(9,3))
sqKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(5,5))
#顶帽操作
tophat=cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel)
cv_show('tophat',tophat)
#-----找到数字边框---------
# 1、通过闭操作(先膨胀,再腐蚀)将数字连在一起
closeX=cv2.morphologyEx(tophat,cv2.MORPH_CLOSE,rectKernel)
cv_show('closeX',closeX)
#THRESH_OTSU会自动寻找到合适的阈值,适合双峰,需要把阈值参数设置为0
thresh=cv2.threshold(closeX,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
# 再来一个闭操作
# thresh1=cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel)
# cv_show('thresh1',thresh1)
#计算轮廓
_,threshCnts,h=cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts=threshCnts
cur_img=image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,255,0),3)
cv_show('cur_img',cur_img)
#遍历轮廓,找到数字部分像素区域
locs=[]
for (i,c) in enumerate(cnts):
(x,y,w,h)=cv2.boundingRect(c)#计算外接矩形
ar=w/float(h)
#选择合适区域
if ar>2.5 and ar<4.0:
if (w>40 and w<55) and (h>10 and h<20):
locs.append((x,y,w,h))
#将轮廓从左到右排序
locs=sorted(locs,key=lambda x:x[0])
output=[]
for (i,(gX,gY,gW,gH)) in enumerate(locs):
groupOutput=[]
group=gray[gY-5:gY+gH+5,gX-5:gX+gW+5]
cv_show('group',group)
group=cv2.threshold(group,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('group',group)
group_,digitCnts,hierarchy=cv2.findContours(group.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
digitCnts=myutils.sort_contours(digitCnts,method='left-to-right')[0]
for c in digitCnts:
(x,y,w,h)=cv2.boundingRect(c)
roi=group[y:y+h,x:x+w]
roi=cv2.resize(roi,(57,88))
cv_show('roi',roi)
#使用模块匹配,计算匹配得分
scores=[]
##在模板中计算每一个得分
#digits 是一个字典
#digits.items() 方法会返回一个包含字典中所有键值对的可迭代对象,其中每个元素是一个元组,元组的第一个元素是键,第二个元素是对应的值。
for (digit,digitROI) in digits.items():
## 模板匹配
#cv2.matchTemplate此函数用于在一幅图像里查找与给定模板最匹配的区域
# roi:代表输入图像,也就是要在其中查找模板的图像。
# digitROI:代表模板图像,也就是你想要在输入图像中查找的部分。
# cv2.TM_CCOEFF:表示匹配方法,这里采用的是相关性系数匹配法。
#函数会返回一个二维的 NumPy 数组
result=cv2.matchTemplate(roi,digitROI,cv2.TM_CCOEFF)
#cv2.minMaxLoc 函数用于在一个单通道的矩阵(通常是图像或模板匹配结果)中查找最小值、最大值以及它们对应的位置。
#该函数返回一个包含四个值的元组,依次为:
# 矩阵中的最小值。
# 矩阵中的最大值。
# 最小值所在的位置(以元组 (x, y) 形式表示)。
# 最大值所在的位置(以元组 (x, y) 形式表示)
(_,score,_,_)=cv2.minMaxLoc(result)
scores.append(score)
#np.argmax 用于返回数组中最大值所在的索引。
#例如,如果 scores = [1, 5, 3],那么 np.argmax(scores) 会返回 1,
#str 是 Python 内置函数,用于将一个对象转换为字符串类型。
groupOutput.append(str(np.argmax(scores)))
# 画出来
cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),1)
# cv2.putText()是OpenCV库中的一个函数,用于在图像上添加文本。
cv2.putText(image,''.join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)
output.extend(groupOutput)
print('Credit Card Type:{}'.format(FIRST_NUMBER[output[0]]))
print('Credit Card#:{}'.format(''.join(output)))
cv2.imshow('image',image)
cv2.waitKey(0)
打印输出结果如下图所示