当前位置: 首页 > news >正文

手机摄像头如何识别体检的色盲检查图的数字和图案(下)

手机摄像头如何识别体检的色盲检查图的数字和图案(下)

--专门对付色盲检查图的转

  • 上一篇:Android手机摄像头如何识别色盲色弱卡的数字和图案(上)

    下一篇:编写中。


  • 一、前

前面篇章《Android手机摄像头如何识别色盲色弱卡的数字和图案(上)》中,我们设计了一个算法,使Android手机的APP能通过摄像头预览的YUV画面,进行专门的加工和运算,提取了红色和绿色的像素并抑制其它颜色的表达。修正和高亮了要检测的目标画面上的图案,使它真的能通过普通体检时医生手上拿的那本“色盲检查图”的前面大部分页面的图案数字识别

但在实际检测中,我们发现,专门针对红色和绿色的修正办法,具有很大的局限性。在实际过滤检测的过程中,算法对【橙色】【粉色+紫色】【深绿色】【紫色+肉色】【蓝色】等等色系组成的“色盲检查图”不能很精准的识别。而且把算法将原本五彩绚丽的图案给弄成灰度图甚至黑白二值图的算法,在体验效果上是不友好的。

我们经过针对性的分析和扩展性的考虑,摒弃掉了专门针对某个颜色或某几种颜色进行运算处理的做法。采用色相环的方式,将所有的颜色,按照色相环的固定幅度进行色相偏移。在保留了RGB颜色空间的情况下,很好的避开了“色盲检查图”中专门针对红绿色盲、蓝色盲和全色盲的指定目标,实现网络上几乎所有的检查图均能正常识别的良好普适性。

识别后的效果,如下图所示:

体验和下载地址:(安装后点击主界面右上角的扫码图标即可体验)

智能拨号器App:http://120.78.211.195:8060/Dialer.apk

  • 二、与上版算法识别效果的对比

虽然说最终总体的目标任务都是相同的:就要能通过普通体检时医生手上拿的那本“色盲检查图”的前面大部分页面的图案数字识别即可。新版的算法不会抑制某一部分颜色,也就意味着:转换后的图像也是RGB彩色的图像。对于人类肉眼来说,彩色图像的辨识率明显要高于低饱和度的灰度图像。

新旧版本的色盲矫正算法的识别效果,示例大致如下左右两侧的图像所示:

从效果来看,运算后的目标数字986,均能很好的从原版的干扰数字358中分离了出来。新版算法最大的优势是没有丢掉其它的颜色,这样如果不能第一眼识别,可以左右晃动镜头,算法会根据收集到反光的不同的颜色,动态高亮的展示目标的数字。

如果对当前的强化效果不满意,用户可以自由的拖动APP界面右下角的【色相调节】的SeekBar的滑块。使预览画面沿着色相环进行对应比例幅度的整体偏移,从而自行检验效果。

  • 三、对上一版不容易识别的图案的适配

上一版算法的图案中,由于它仅强化了红色和绿色的颜色空间、抑制了非红绿的其它颜色。我们在网络图片的检验过程中,过滤出一批该算法不太容易识别到的类型。

如下图的橙色和粉色的示例图像:

色觉辨识能力测试-原始网络图像

直接根据上图扫描的来的-修正后的图像

可以很容易看出,原图中左边是数字45,右边是动物兔子。因此哪怕是正常视觉的人群,使用APP的算法进行辅助时,也能很好的第一眼就能确认目标的数字和图案,排除干扰的图案。

  • 四、新版算法对网络上色盲图像的识别效果

与上一版一样,我们用这个方案的算法,对百度图片上面的一堆的图片进行扫描操作,截图了一部分比较经典的案例和图形,如下图所示。

可以看出,对于大多数的“专门为色盲色弱人群定制的颜色空间的图片”,通过色相偏移的办法,基本都能很好的规避了过去,从而一眼就能识别出真正的目标图案。

  • 五、复杂图案的识别效果

前文中,我们在网络图片中捕获了一个针对特定色盲人群的检查图像,它的干扰色2719是非常浓厚的。这个图案,在我们第一版的算法和其它常规方式是无法正常提取得到目标数字的,至少不能第一眼就认得出来目标数字。

原图大致如下:

新版色相偏移算法的识别效果大致如下图左右两侧的效果所示:

经试验,由于干扰底色太过于浓厚,单纯的色相偏移的办法转换了之后,图像上的目标数字仍然被干扰数字盖压住了。我们肉眼简单分析后发现识别的干扰色在经过色相偏移后,呈现出红色(色相调节可以从0°调节到360°,一定有一个偏移量能使干扰色转化为红色)。因此,我们可以使用APP右上角的【去除红色】的选项,将色相偏移后的图像,整体去掉干扰色后,最终画面呈现出的就是没有干扰颜色之后的真实的目标数字。

可以从右侧的图示中很容易的看出,这个识别的图片目标的数字是6475。因此在这个测试图片当中,【去除红色】的复选框按钮,清理掉干扰色了之后,起到了专注识别的作用。在某些场景下,可能需要额外开启这个功能进行辅助识别。

  • 六、小结

至此,我们采用了一种通用性很强的方式,来实现了能通过普通体检时医生手上拿的那本“色盲检查图”的前面大部分页面的图案数字识别的具体效果。但是否能像抖音宣称卖眼镜的那样:眼镜宣称可用于“驾照、换本、体检、兵检”各种场景,那就说笑了,旁边站着的医生是吃干饭的,能让你这么忽悠?

但是无论如何,我们往这个方向的探索,以及输出的成果,对特定人群还是有一定的积极意义。感兴趣的读者和朋友,可以下载APP来进行对比和试用,至少个人感觉,APP的色相调节的功能,比单纯某一两个实体眼镜的偏光效果,在覆盖兼容性上会更强,仅供参考。

http://www.dtcms.com/a/523858.html

相关文章:

  • 政务系统信创改造中,金仓日志如何满足等保2.0三级审计要求
  • 记录一个监控网卡某个IP发送流量
  • Python-UnitTest框架
  • 模型-模型压缩:量化、剪枝、蒸馏、二值化
  • UE5 蓝图-12:pawn蓝图,轴映射-鼠标右键,补充轴映射与操作映射的区别。相机的旋转俯仰逻辑,伸缩逻辑,浮点差值函数 FInterpTo;
  • Vcenter7使用主机配置文件重置ESXI主机 root 密码
  • STL 容器:List
  • 做网站销售好累网上开店的货源渠道有哪些
  • 图像,视频Lora模型训练的Timestep Type时间步类型
  • 告别云端依赖!ComfyUI本地化视频生成实战教程+cpolar实战
  • Android16之如何获取APP、Bin进程的UID(二百六十三)
  • 在JavaScript / HTML中,无法通过开发者工具查看DOM元素中input里输入的密码
  • 像素塔防游戏:像素守卫者
  • 什么是栈?深入理解 JVM 中的栈结构
  • Go Web 编程快速入门 07.2 - 模板(2):解析与执行(含Demo)
  • 公司用wordpress建站用花钱大连网站设计开发
  • 建设网站需要下载神呢软件吗重庆企业网站推广公司
  • 常规面光源在工业视觉检测上的应用
  • 数据结构——直接插入排序
  • 如何开公司做网站素材免费网站
  • Spring Boot 配置优先级
  • 【架构】-- Nightingale:云原生监控告警平台的深度解析
  • 【Leetcode】
  • 以LIS为突破口的全栈信创实践——浙江省人民医院多院区多活架构建设样本
  • 使用 IntelliJ IDEA 连接 Docker
  • Maya Python入门: polySphere()球体的形状节点操作
  • 目前最好的引流方法上海专业seo
  • 第一篇使用HTML写一个随机点名网页
  • 沈阳网站设计制作电子商务网站上线活动策划
  • 使用 Undertow 替代 Tomcat