当前位置: 首页 > news >正文

【celeba】-数据集的介绍

CelebA 数据集在 MTCNN 中的使用

1 数据集结构

CelebA_副本/
├── Anno/
│   ├── list_bbox_celeba.txt       # 边界框
│   ├── list_landmarks_celeba.txt  # 5 关键点
│   ├── list_attr_celeba.txt       # 40 属性
│   └── identity_CelebA.txt        # 身份
├── Img/
│   ├── img_celeba_original/       # 202 599 张 JPG(已解压)
│   └── img_align_celeba/          # 202 599 张 JPG(对齐后)
└── Eval/└── list_eval_partition.txt    # 训练 / 验证 / 测试划分

2 标注格式

2.1 边界框

格式:image_id x_1 y_1 width height
示例:000001.jpg 95 71 226 313

2.2 关键点

格式:image_id lefteye_x lefteye_y righteye_x righteye_y nose_x nose_y leftmouth_x leftmouth_y rightmouth_x rightmouth_y
示例:000001.jpg 165 184 244 176 196 249 194 271 266 260

2.3 属性

40 个二进制标签(1 / -1)。
首图示例:无胡茬、拱形眉、有吸引力、无眼袋、不秃头、无刘海……

3 在 MTCNN 中的使用

3.1 样本划分

  • 正样本:IOU > 0.7,轻微偏移 ±20 %
  • 部分样本:0.3 < IOU ≤ 0.7,中等偏移 ±100 %
  • 负样本:IOU < 0.1,大幅偏移 ±200 %

3.2 网络输入尺寸

  • P-Net:12×12
  • R-Net:24×24
  • O-Net:48×48

3.3 训练数据格式

每行:image_path cls offset_x1 offset_y1 offset_x2 offset_y2

3.4 损失函数

  • 分类:BCE
  • 回归:MSE
  • 总损失:α × cls_loss + (1-α) × offset_loss

4 对齐 vs 原始图像

特征原始野生图像对齐裁剪图像
多样性角度、光照、遮挡丰富统一居中、大小一致
训练适用性适合 MTCNN 训练易过拟合
用途训练标准化测试

5 代码验证

  • 属性:未使用(list_attr_celeba.txt 未被读取)。
  • 关键点:代码中全部注释掉,输出设为 0。
  • 路径:原始设计指向 img_celeba.7z\img_celeba,现改为
    CelebA_副本/Img/img_celeba_original/img_celeba/(已解压)。

6 最终配置

  • 训练数据:使用原始野生图像并通过数据增强制造样本。
  • 路径修改:将 img_path 指向解压后的原始图像目录。
http://www.dtcms.com/a/324441.html

相关文章:

  • 驱动电路设计
  • Ollama+Deepseek+Docker+RAGFlow打造自己的私人AI知识库
  • 【软件测试】性能测试 —— 工具篇 JMeter 介绍与使用
  • AI质检数据准备利器:基于Qt/QML 5.14的图像批量裁剪工具开发实战
  • 升级 JDK 17 碰到的请求 https 问题
  • 从0开始的中后台管理系统-5(userList页面功能实现)
  • 自测电脑有没有木马
  • 深度学习周报(8.4~8.10)
  • 使用binutils工具解析目标文件符号表(叁)
  • Datawhale AI夏令营 多模态RAG环境问题
  • 海关 瑞数 失信企业 逆向 分析 后缀 rs
  • es查询小结
  • CSS优先级、HTTP响应状态码
  • BGP综合大实验
  • 人工智能-python-机器学习-模型选择与调优实战指南:从交叉验证到朴素贝叶斯分类
  • 为wordpress顶部header.php文件中调用不同的标题和摘要
  • 学习中的杂项知识
  • 在Word和WPS文字一页中实现一栏与多栏混排
  • 打靶日常-upload-labs(21关)
  • MyBatisPlus插件原理
  • Java 虚拟机运行时数据区组成详解
  • 【Vue2与Vue3的核心区别】响应式、运行时、编译器
  • 医学统计(随机对照研究分类变量结局数据的统计策略2)
  • 五种 IO 模型与阻塞 IO
  • Redis一站式指南二:主从模式高效解决分布式系统“单点问题”
  • 对话式BI有什么用?不懂技术也能用对话式BI搞定业务报表
  • 面对信号在时频平面打结,VNCMD分割算法深度解密
  • AMS1117-3.3 低压差线性稳压器 (LDO) 3.3V芯片 引脚图中文资料
  • 【Python 工具人快餐 · 第 4 份】
  • 【LLM】什么是Function Calling以及实现原理