当前位置: 首页 > wzjs >正文

永兴县网站建设数据分析培训课程

永兴县网站建设,数据分析培训课程,做网站用c 还是php,wordpress如何添加网站地图目标:针对一张身份证照片,把身份证号码识别出来(转成数字或字符串)。 实现思路:需要将目标拆分成两个子任务:(1) 把身份证号码区域从整张图片中检测/裁剪出来;(2) 将图片中的数字转化成文字。第…

目标:针对一张身份证照片,把身份证号码识别出来(转成数字或字符串)。

实现思路:需要将目标拆分成两个子任务:(1) 把身份证号码区域从整张图片中检测/裁剪出来;(2) 将图片中的数字转化成文字。第一个子任务用OpenCV(如何自行编译OpenCV源码?),第二个子任务主要仰仗Tesseract(注:Tesseract是著名的OCR文字识别开源项目)。

使用OpenCV做图像处理的大致过程为:首先要将彩色图像转成灰度图,再进一步做二值化转换。为了把身份证号码区域整个圈出来,需要继续对图像进行“膨胀”处理,使得每个数字的小区域都与相邻数字的小区域连接起来,连成一个大区域。这样处理之后,在用cv::findContours查找轮廓时,就可以根据身份证号码区域的面积和宽高比把它挑选出来了。

具体代码实现

首先用OpenCV加载图片文件:

Mat srcImage = imread(".\\assets\\pigidcard.png");

接着对图像进行灰度化和二值化处理:

Mat grayImg;
cv::cvtColor(srcImage, grayImg, COLOR_BGR2GRAY);
Mat binary;
cv::threshold(grayImg, binary, 0, 255, THRESH_BINARY_INV | THRESH_OTSU);

到这一步,图像看起来是这样的:

接着要做“膨胀”处理。这一步非常关键!需要调整下面这个Size类型的内核大小,目标是让身份证号码的这些数字前后相连,形成一个整体的矩形区域。

Mat kernel = cv::getStructuringElement(MORPH_RECT, Size(26, 26));
Mat dilation;
cv::dilate(binary, dilation, kernel);

到这一步,图像看起来是这样的:

实际的轮廓/区域分布是这样的:

然后就是遍历图像中的所有轮廓。我们设定两个条件,当轮廓的面积以及轮廓外边框的宽高比都大于某个值(根据实际情况而定),我们就认为当前这个轮廓就是身份证号码区域,可以把它裁剪出来。

std::vector<std::vector<Point>> contours;
std::vector<Vec4i> hierarchy;
cv::findContours(dilation, contours, hierarchy, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE);for (size_t i = 0; i < contours.size(); i++) {double area = cv::contourArea(contours[i]);Rect roi = cv::boundingRect(contours[i]);double aspectRatio = (double)roi.width / roi.height;// 根据实际情况调整这两个阈值if (area > 40000 && aspectRatio > 10) {Mat cropped = binary(roi);imshow("ID Card - number only", cropped);// 继续使用 Tesseract OCR// …break;}
}

上面代码运行的结果:cropped对象是裁剪出来的仅含一串身份证号码的小图片。注意这是一个二值图,而且不是膨胀处理后的图像哦!接着轮到Tesseract登场了,把这个图片中的数字转成字符串。(注:请参考这篇文章自行把Tesseract源代码编译成静态库。)

#include "baseapi.h"
#include "allheaders.h"#pragma comment(lib, "leptonica-1.84.1.lib")
#pragma comment(lib, "tesseract54.lib")// 使用 Tesseract OCR
tesseract::TessBaseAPI tess;
if (tess.Init("tessdata", "eng") == 0) {tess.SetPageSegMode(tesseract::PSM_SINGLE_BLOCK);// Tesseract无法识别二值图!转换回RGB图像Mat ocrImg;cv::cvtColor(cropped, ocrImg, COLOR_GRAY2BGR);int bytesPerPixel = GetBytesPerPixel(ocrImg);tess.SetImage((uchar*)ocrImg.data, ocrImg.cols, ocrImg.rows, bytesPerPixel, ocrImg.cols * bytesPerPixel);char* outText = tess.GetUTF8Text();std::cout << "ID numbers: " << outText << std::endl;delete[] outText;tess.End();
}

打完收工!o(* ̄▽ ̄*)ブ

P.S. 完整的代码可以从这里下载:https://github.com/luqiming666/OpenCVMisc。查看OpenCVMiscDlg.cpp 文件中的_DetectIDCard_WithGoodDilation() 函数实现即可。我也上传了Tesseract库文件,但只有Release版。如果要验证OCR效果,需要把OpenCVMisc项目的配置切换到Release + x64,并且在OpenCVMiscDlg.cpp文件头部放开这个宏定义:#define _ENABLE_TESSERACT_

http://www.dtcms.com/wzjs/165482.html

相关文章:

  • 服务二级公司网站建设广告联盟全自动赚钱系统
  • 盐城做网站的公司地址那个推广平台好用
  • 网站是哪个公司做的网站收录登录入口
  • 做女装批发哪个网站好爱站网能不能挖掘关键词
  • 网站栅格化怎么做长春seo排名优化
  • 一站式的手机网站制作网站后台管理系统
  • 网站access数据怎么做下载爱城市网app官方网站
  • 南宁如何做百度的网站bing搜索引擎入口官网
  • 做商城网站还要服务器推广工作的流程及内容
  • 叮当app制作平台登录清远网站seo
  • 北京附近做网站的公司一呼百应推广平台
  • 酷家乐必须先学cad吗乐云seo官网
  • 做个网站跳转链接怎么做百度西安分公司地址
  • 阅读分享网站模板北京seo优化
  • 浙江杭州下沙做网站企业网站设计服务
  • 浦东新区网站优化推广中国北京出啥大事了
  • 高端网站建设哪家更专业信息如何优化上百度首页公司
  • 那种网站后台最好企业seo关键词优化
  • 汕头网站定制深圳市社会组织总会
  • 建设银行etc的网站是哪个好电子商务网站建设规划方案
  • 什么是网站建设的三次点击原则怎样做seo搜索引擎优化
  • app上架应用市场需要什么条件seo整站优化解决方案
  • 洛阳市住房和城乡建设网站北京seo站内优化
  • 昆明网站优化广州seo顾问服务
  • 疑问句做网站标题网页版百度云
  • 文化传媒公司网站模板做网站需要多少钱
  • 政府网站建设管理方案快照网站
  • 网站网站制作网站的软文关键词排名推广
  • 电商设计参考网站seo站外推广有哪些
  • 国外b站视频app线上广告推广