当前位置: 首页 > news >正文

【PVR】《Palm Vein Recognition and Large-scale Research based on Deep Learning》

在这里插入图片描述
邬晓毅. 基于深度学习的掌静脉识别及规模化研究[D]. 四川:电子科技大学,2024.

文章目录

  • 1、背景
  • 2、相关工作
  • 3、创新点和贡献
  • 4、方法和实验
    • 4.1、知识介绍
    • 4.2、基于自适应损失函数的掌静脉识别算法研究
    • 4.3、退化图像的掌静脉识别鲁棒性提升研究
    • 4.4、掌静脉识别系统规模化
  • 5、总结

1、背景

本文的研究贯穿一个主线即如何让掌静脉识别算法能够在复杂场景表现良好以适应可能的应用场景如安保、民生等领域。

掌静脉识别主要分为两个部分:

  • 端到端掌静脉识别算法
  • 针对退化图像的掌静脉识别鲁棒性提升方法

本文主要研究基于 940nm 波段图像的掌静脉识别算法。

特征提取是从掌静脉图像中提取具有代表性的特征信息,如静脉血管的分布模式分支情况曲线形状等。

本文主要研究基于轻量化深度神经网络的有监督掌静脉身份识别。

2、相关工作

  • 掌静脉识别的研究现状

    • 传统
    • 深度学习
  • 退化图像的掌静脉鲁棒性提升的研究现状

    • 退化图像衡量方法
    • ROI 定位精度提升
    • 对比度增强
    • 自适应直方图均衡化等
  • 掌静脉识别系统规模化的研究

    • 通过轻量化模型,有效降低边缘设备的负载,并通过 C/S 模式部署到企业的实际应用中,有效提高了效率和鲁棒性,带来了一定的积极经济效益。

在实际应用场景中,镜头获取的数据往往是退化图像即非标准环境数据,需要考虑光照、角度、和距离等因素对数据的影响。

近年来基于深度学习的手势检测与定位得到了科研人员的广泛关注。经过大量真实样本喂养训练的深度神经网络可以对复杂场景下的手部关键点定位和姿态检测具有更好的性能表现。

3、创新点和贡献

  • 掌静脉识别神经网络算法研究(自适应 loss)
  • 退化图像的掌静脉识别鲁棒性提升研究(退化图片过滤、ROI 提取、对比度增强
  • 掌静脉识别系统规模化(功能接口、数据加密、高维向量检索、并发压测)

在这里插入图片描述

4、方法和实验

4.1、知识介绍

Center Loss

在这里插入图片描述

在这里插入图片描述
参考 CenterLoss原理详解(通透)


Triplet Loss

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

4.2、基于自适应损失函数的掌静脉识别算法研究

在这里插入图片描述
输入 128 x 128,输出 512

把 center loss 改为自适应了

motivation
在这里插入图片描述

前期提高 center 的权重,后期降低

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

实验数据集

在这里插入图片描述
训练过程可视化

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
比原版 center loss 是有提升,但是很有限
在这里插入图片描述

4.3、退化图像的掌静脉识别鲁棒性提升研究

实际上,摄像头获取的图像有一部分往往是退化图像。退化图像是指由于各种原因而失去了原始图像质量的图像。这种退化可以是由摄像机或传感器本身的技术限制、环境条件、图像传输中的噪声、压缩算法或存储过程
等引起的。退化图像可能会丢失细节、清晰度和色彩信息,导致图像模糊、失真或含有噪声。

在这里插入图片描述
作者自建数据集,3000 张手部静脉图像。这些静脉图像分别来自 300 个志愿者的手掌静脉信息

在这里插入图片描述

(1)图像退化衡量研究
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

正常类 prue,非正常类 blur

在这里插入图片描述
Laplacian 法可以很好的分开

在这里插入图片描述
Brenner 法可以很好的分开

作者基于 Laplacian 和 Brenner 算法进行融合来做退化图像衡量方法。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(2)ROI 定位精度鲁棒性研究

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(3)对比度增强研究

在这里插入图片描述
在这里插入图片描述
作者 DCP 和 POSHE 融合增强算法

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.4、掌静脉识别系统规模化

在这里插入图片描述

(1)高维向量检索方法

加速特征匹配

特征向量的高维检索方法 HNSW(Hierarchcal Navigable Small World graphs)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(2)接口设计
在这里插入图片描述
在这里插入图片描述

5、总结

  • 高维向量检索方法 HNSW

  • 对比度增强 POSHE

  • 万精油,weighted

http://www.dtcms.com/a/121936.html

相关文章:

  • 今日行情明日机会——20250409
  • P9242 [蓝桥杯 2023 省 B] 接龙数列
  • Anacond虚拟环境里安装GPU版本Pytorch
  • linux下截图工具的选择
  • Linux权限管理:从入门到实践
  • 网页部署到宝塔服务器上,发送请求报错?org.springframework.data.redis.RedisSystemException,让我来看看
  • 算法训练之动态规划(一)
  • 为什么在Altium原理图中画线会自动链接到附近?
  • Zephyr、FreeRTOS、RT-Thread 定时器区别分析
  • 【Ragflow】14.MinerU解析脚本,接入ragflow知识库
  • Windows 图形显示驱动开发-WDDM 2.0功能_供应和回收更改
  • Seq2Seq - GRU补充讲解
  • DP_AUX辅助通道介绍
  • Testbench设计
  • 起跑有几种起跑方式·棒球1号位
  • 【嵌入式系统设计师】知识点:第11 章 嵌入式系统设计案例分析
  • MQ保证消息幂等
  • (四十一)Dart 中的空安全与 `late` 关键字教程
  • 网络基础-路由技术和交换技术以及其各个协议
  • 每日算法-250409
  • 智能体:重塑未来的智能助手及其在产品设计中的应用
  • 逻辑分析仪怎么用?怎么看PWM(以Saleae为例)​
  • TQTT_KU5P开发板教程---DDR4基于IP核 SDRAM(MIG)的测试
  • 接口测试性能指标:QPS、TPS、OTPS、TP99
  • 【深度学习基础】Temporal Fusion Transformer
  • TCP转发隧道
  • Go并发背后的双引擎:CSP通信模型与GMP调度|Go语言进阶(4)
  • K8S学习之基础七十九:关闭istio功能
  • 【c语言】倒置字符串
  • map/multimap