当前位置: 首页 > news >正文

【DeepID】《Deep Learning Face Representation from Predicting 10,000 Classes》

在这里插入图片描述

CVPR-2014

Sun Y, Wang X, Tang X. Deep learning face representation from predicting 10,000 classes[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2014: 1891-1898.


文章目录

  • 1、Background and Motivation
  • 2、Related Work
  • 3、Advantages / Contributions
  • 4、Method
    • 4.1、Deep ConvNets
    • 4.2、Feature extraction
    • 4.3、Face verification
  • 5、Experiments
    • 5.1、Datasets and Metrics
    • 5.2、Multi-scale ConvNets
    • 5.3、Learning effective features
    • 5.4、Over-complete representation
    • 5.5、Method comparison
  • 6、Conclusion(own)/ Future work


1、Background and Motivation

随着计算机视觉和深度学习技术的快速发展,人脸验证作为生物特征识别的一种重要方式,在安全监控、人机交互、社交媒体等多个领域展现出巨大潜力。

然而,在无约束或非控制环境下(如光照变化、姿态多样、表情丰富等),人脸图像的变异极大,给准确的人脸验证带来了巨大困难。

传统的基于低层次特征提取和浅层模型的方法(over-complete low-level features, followed by shallow models )在处理这类复杂变化时表现不佳,因此需要更强大的特征表示和模型来提高人脸验证的准确性和鲁棒性。

本文提出一种通过深度学习来学习高级人脸特征表示的方法——Deep hidden IDentity features (DeepID),以提高人脸验证的准确性和泛化能力。

2、Related Work

  • high dimensional over-complete face descriptors, followed by shallow models.
    • 26K learning-based (LE) descriptors
    • 1.7M SIFT
    • 1.2M CMD
  • learned identity related features based on low-level features
  • deep models

3、Advantages / Contributions

  • 提出 DeepID 特征表示,与传统方法使用低层次特征或浅层模型相比,DeepID 包含了更丰富、更本质的人脸身份信息,显著提高了人脸验证的准确性。
  • deepID 有一定的泛化性,can be generalized to other tasks (such as verification) and new identities unseen in the training set
  • 在LFW数据集上取得优异成绩,97.45% verification accuracy on LFW is achieved with only weakly aligned faces.

4、Method

在这里插入图片描述
over-complete representations.

highly compact and discriminative features are acquired

4.1、Deep ConvNets

four convolutional layers

在这里插入图片描述

特征提取是一个 4 层的 CNN,输入是不同的人脸 patch

长方形 patch 的尺寸为 39x31xk,正方形 patch 的尺寸为 31x31xk,彩色 patch k = 3,灰色 patch k = 1

The features extracted from different face regions are complementary and further boost the performance

卷积操作的公式化表达如下

在这里插入图片描述

activation function 用的是 ReLU

max pooling 的公式化表达如下

在这里插入图片描述

conv3 和 conv4 之间加了 bypass connection 结构(shortcut),666

在这里插入图片描述

The ConvNet output is an n-way softmax predicting the probability distribution over n different identities

在这里插入图片描述

4.2、Feature extraction

Features are extracted from 60 face patches with ten regions, three scales, and RGB or gray channels

10 x 3 x 2 = 60 patches

在这里插入图片描述

The total length of DeepID is 19, 200 (160×2×60), which is ready for the final face verification

60 种 patch 训练了 60 个网络,每个网络的输出是 160 维特征,2 是 horizontall flipped 的输出得到的特征

We trained 60 ConvNets, each of which extracts two 160-dimensional DeepID vectors from a particular patch and its horizontally flipped counterpart

4.3、Face verification

Joint Bayesian 或者 neural network 方法都可以,输入就是 ConvNets 提取到的特征,输出 1:1 验证结果

(1)Joint Bayesian
在这里插入图片描述
核心公式
在这里插入图片描述

(2)neural network

在这里插入图片描述
注意这里 640 的计算,前面已知 60 patch,每个 patch 160 特征加上 horizontal filp 也才 320 特征,怎么变成 640 了呢?

因为 face verification 每次输入两个人脸

在这里插入图片描述

在这里插入图片描述

5、Experiments

5.1、Datasets and Metrics

LFW

  • 5749 people,only 85 have more than 15 images, and 4069 people have only one image

CelebFaces

  • 87, 628 face images of 5436 celebrities from the Internet,with approximately 16 images per person on average.

CelebFaces+

  • extend CelebFaces to the CelebFaces+ dataset, which contains 202, 599 face images of 10, 177 celebrities

evaluate our algorithm on LFW

trained our model on CelebFaces

We randomly choose 80% (4349) people from CelebFaces to learn the DeepID, and use the remaining 20% people to learn the face verification model (Joint Bayesian or neural networks).

评价指标

  • top-1 error rates

5.2、Multi-scale ConvNets

在这里插入图片描述

The lower error rates indicate the better hidden features learned.

5.3、Learning effective features

在这里插入图片描述

人数变多了,hidden 层不变还是能 hold 住
在这里插入图片描述

More identity classes help to learn better hidden representations that can distinguish more people (discriminative) without increasing the feature length (compact).

可视化看看学到的 160 维隐藏层特征(远小于训练时候的 id 数量)

在这里插入图片描述

同 id 的ren,激活(白色)会相似一些,不同 id 的,激活有差异

5.4、Over-complete representation

best performing single patch (k = 1),

global color patches in a single scale (k = 5),

all the global color patches (k = 15),

all the color patches (k = 30),

all the patches (k = 60)

在这里插入图片描述

The curves show that the performance may be further improved if more features are extracted.

5.5、Method comparison

在这里插入图片描述
Number of points 指的是人脸对齐时关键点的数量,eg,It utilized 3D alignment and pose transform as preprocessing,或者比较简单的眼睛、鼻子、嘴巴五个关键带你

Low feature dimensions indicate efficient face recognition systems

feature dimension 才 150,

6、Conclusion(own)/ Future work

  • 参考学习来自 人脸识别合集 | 2 DeepID解析
  • 在这里插入图片描述
  • 港中文孙祎、汤晓鸥、王晓刚
  • Q:face identification(面部识别)和 face recognition(人脸识别)的区别
  • A:面部识别主要是一对多的比对过程,而人脸识别则涵盖了更广泛的技术步骤,包括人脸检测、预处理、特征提取和比对识别等。
  • Face Identification,1:N
  • Face Verification,1:1
  • 在这里插入图片描述
  • 注意特征维度的计算,每个 patch 160 不多,但是每张图 60 个 patch,加上 horizontal flip,提取的特征也很庞大,60x2x160
  • 在这里插入图片描述

更多论文解读,请参考 【Paper Reading】

http://www.dtcms.com/a/317889.html

相关文章:

  • 项目中使用的设计模式
  • GPT-OSS 与 Ollama 完整安装使用教程
  • 如何自动生成 API 接口文档 - 一份详细指南
  • 强强联合:OpenAI正式登陆AWS!
  • 基于AI的自动驾驶汽车(AI-AV)网络安全威胁缓解框架
  • Windows 如何上架 iOS 应用?签名上传全流程 + 工具推荐
  • 跨过BI,企业能直接用AI实现数据分析吗?
  • Template 显式实例化 隐式实例化
  • Ethereum: 用Python链上查询 Uniswap V3 ETH/USDC 资金池资产
  • 云手机的应用场景较为广泛,主要包括以下几个方面:
  • C++ - 仿 RabbitMQ 实现消息队列--服务器模块实现
  • NAT转化
  • 单变量单步时序预测:CNN-BiGRU卷积神经网络结合双向门控循环单元
  • 从 “认知优势” 到现实赋能:DPVR AI Glasses 重构智能穿戴价值
  • 飞算JavaAI开发平台:重构开发全流程——从需求到工程的智能化跃迁
  • coze1-podman容器化部署coze
  • Kafka-exporter采集参数调整方案
  • npm scripts 使用指南
  • 快手AI团队开源 KAT (Kwaipilot-AutoThink) 思考模型
  • 【ROS1】13-元功能包
  • electron:vue3+vite打包案例
  • 从零搭建React框架--第一章:create-react-app、antd、less
  • LAS平台Vibe Data Processing:AI驱动的数据处理新范式
  • Chrontel昆泰-【CH7036A-BF】CH7036 LVDS to HDMI/VGA/LVDS Converter
  • 基于MATLAB实现的具有螺旋相位板的4F系统用于图像边缘增强的仿真
  • 软件定义汽车 --- 电子电气架构的驱动
  • 在ubuntu上使用jenkins部署.net8程序
  • 【概念学习】早期神经网络
  • Redis 缓存三大核心问题:穿透、击穿与雪崩的深度解析
  • [AI 生成] hive 面试题