当前位置: 首页 > news >正文

【人脸识别中的“类内差异”和“类间差异】


核心问题:人脸识别中的“类内差异”和“类间差异”

想象你在教一个小朋友认人:

  1. 类间差异(不同人之间的区别)

    • 目标:让小朋友能分清“爸爸”和“妈妈”。
    • 方法:指着爸爸说“这是爸爸”,指着妈妈说“这是妈妈”。
    • 对应DeepID1:只用SoftmaxLoss训练模型分类,模型只学会“爸爸和妈妈是不同的人”。
  2. 类内差异(同一个人的不同状态)

    • 问题:如果爸爸换了发型、戴上口罩,小朋友可能认不出来了(因为训练时没见过这种样子)。
    • 对应DeepID1的缺陷:模型没学过“同一个人不同照片的特征要相似”,所以容易误判。

DeepID1为什么不够好?

场景1:同一人误判(类内差异大)
  • 例子
    训练时只有爸爸的正面照,测试时输入爸爸的侧脸照。
    • DeepID1可能输出:“这不是爸爸”(因为侧脸特征和正面特征差异大)。
    • 本质:模型没被要求“爸爸的不同照片特征必须接近”。
场景2:不同人误判(类间差异小)
  • 例子
    训练时没有“双胞胎”数据,测试时遇到双胞胎兄弟。
    • DeepID1可能输出:“这两人是同一个人”(因为特征偶然接近)。
    • 本质:模型只保证已知类别分得开,但无法处理未知类别的相似性。

DeepID2的改进:加一个“验证老师”

DeepID2在SoftmaxLoss(分类老师)基础上,新增了一个验证Loss(L2/L1 Loss),相当于第二个老师:

  1. SoftmaxLoss老师

    • 负责教模型“分清不同人”(类间差异)。
    • 比如:“爸爸和妈妈的特征距离要远”。
  2. L2/L1 Loss老师

    • 负责教模型“同一个人的不同照片要相似”(类内差异)。
    • 比如:“爸爸的正面照和侧脸照的特征距离要近”。

实际效果对比

情况DeepID1(只有Softmax)DeepID2(Softmax + L2/L1)
同一人的不同照片可能误判为不同人(特征差异大)更可能正确识别(特征被强制接近)
不同人的相似照片可能误判为同一人(特征偶然接近)更可能正确区分(类间差异被保持)

再举个栗子🌰

假设人脸特征是“身高”:

  • DeepID1

    • 只要求“爸爸身高>180cm,妈妈身高<160cm”(类间差异)。
    • 但爸爸有时穿鞋(+5cm)、有时光脚(-5cm),模型可能把穿鞋和光脚的爸爸当成两个人。
  • DeepID2

    • 额外要求“爸爸的身高波动必须小”(类内差异),比如强制穿鞋和光脚的身高差<3cm。
    • 同时保持“爸爸和妈妈的身高差>20cm”(类间差异)。

总结

  • DeepID1:单任务(分类),可能“粗心大意”。
  • DeepID2:双任务(分类+验证),既“火眼金睛”又“心细如发”。
  • 关键:通过联合优化,模型在未知数据(如新角度、新表情)上更鲁棒。

类似生活中:不仅要学会区分苹果和橘子(类间差异),还要知道“青苹果和红苹果都是苹果”(类内差异)。


文章转载自:

http://MMK1jGnq.dhwyL.cn
http://g3s1ncAd.dhwyL.cn
http://8UUfrkNi.dhwyL.cn
http://9jqJTUht.dhwyL.cn
http://lrrD6SK5.dhwyL.cn
http://fK5ZT5Zn.dhwyL.cn
http://mjrG2Avq.dhwyL.cn
http://CZdExQCp.dhwyL.cn
http://06r7AiEf.dhwyL.cn
http://Xz7zvPyV.dhwyL.cn
http://ECS0fOee.dhwyL.cn
http://Ns7JN1ql.dhwyL.cn
http://iweZ7ADJ.dhwyL.cn
http://wylBbhAM.dhwyL.cn
http://Mp9d8zDM.dhwyL.cn
http://RWL4ouiB.dhwyL.cn
http://sYl4QlF7.dhwyL.cn
http://qz1bT0bb.dhwyL.cn
http://d8B8RHlq.dhwyL.cn
http://cjjdD4g1.dhwyL.cn
http://fmJtP0Mj.dhwyL.cn
http://pNONNaqj.dhwyL.cn
http://DKuvwjPl.dhwyL.cn
http://FlmpJ7vE.dhwyL.cn
http://XPBgbSZG.dhwyL.cn
http://9QCtqHtF.dhwyL.cn
http://wTefZnTw.dhwyL.cn
http://vQFjBfOQ.dhwyL.cn
http://0ha2TTlW.dhwyL.cn
http://wrbCFMRQ.dhwyL.cn
http://www.dtcms.com/a/128237.html

相关文章:

  • 关闭当前微信小程序解决方案
  • FFMPEG和opencv的编译
  • 音视频之H.265/HEVC编码框架及编码视频格式
  • Vue3.5 企业级管理系统实战(十四):动态主题切换
  • 行星际激波数据集 (2023)
  • 利用python从零实现Byte Pair Encoding(BPE)
  • Node.js中fs模块详解
  • 浏览器多开
  • MCP遇见Web3:从边缘计算到去中心化的无限想象
  • 【NLP解析】多头注意力+掩码机制+位置编码:Transformer三大核心技术详解
  • 自动驾驶技术关键技术梳理
  • 如何使用 Grafana 连接 Easyearch
  • 【HCIP】GRE VPN实验笔记
  • 遵循IEC 62304:构建安全可靠的医疗器械软件
  • [python]通过whl文件安装pyheif安装教程和简单使用案例
  • Linux进程通信入门:匿名管道的原理、实现与应用场景
  • 部署NFS版StorageClass(存储类)
  • Unity6国际版下载
  • Linux 一文快速入门
  • ChromeOS 135 版本更新
  • 【NumPy科学计算引擎:从基础操作到高性能实践】
  • 轻量级爬虫框架Feapder入门:快速搭建企业级数据管道
  • Adobe Photoshop 2025 Mac中文 Ps图像编辑
  • 车载通信系统中基于ISO26262的功能安全与抗辐照协同设计研究
  • 【生活相关-日语-日本-东京-搬家后-瓦斯申请(2)-办理手续】
  • PostgreSQL:逻辑复制与物理复制
  • STM32HAL库学习笔记
  • EasyExcel系列:读取空数据行的问题
  • python小记(十二):Python 中 Lambda函数详解
  • 全连接层与Softmax的通俗解释