当前位置: 首页 > news >正文

MTCNN 的原理

概述

MTCNN(Multi-Task Cascaded Convolutional Neural Network)是一种基于卷积神经网络的多任务face检测模型。它同时能够检测脸部、定位眼睛、鼻子和嘴巴等关键点,并调整边界框以获得更精确的 crop 图片。

MTCNN 的原理

第一段:精修框(Adjusting Bounding Box)
def create_Onet(weight_path):
    input = Input(shape = [48,48,3])
    # 卷积层1,输出通道数为32,步长为1,填充方式为valid
    x = Conv2D(32, (3, 3), strides=1, padding='valid', name='conv1')(input)
    # PReLU激活函数,共享轴[1,2],即对所有通道进行非线性变换
    x = PReLU(shared_axes=[1,2],name='prelu1')(x)
    # 下采样层(MaxPool),池化大小为3x3,步长为2
    x = MaxPool2D(pool_size=3, strides=2, padding='same')(x)
    
    # 卷积层2,输出通道数为64,步长为1,填充方式为valid
    x = Conv2D(64, (3, 3), strides=1, padding='valid', name='conv2')(x)
    x = PReLU(shared_axes=[1,2],name='prelu2')(x)
    # 下采样层(MaxPool),池化大小为3x3,步长为2
    x = MaxPool2D(pool_size=3, strides

相关文章:

  • LeetCode 148:排序链表 (Sort Linked List)
  • C++基础知识(六)之STL容器
  • Hive之正则表达式RLIKE详解及示例
  • [Computer Vision]实验五:SFM
  • electron-builder打包时github包下载失败【解决办法】
  • 分布式微服务系统架构第92集:智能健康监测设备Java开发方案
  • RJ45网口 与 M12连接器对比(D-code,X-code)
  • 哈希碰撞攻防战——深入浅出Map/Set的底层实现
  • 2025.3.2机器学习笔记:PINN文献阅读
  • uniapp 系统学习,从入门到实战(七)—— 网络请求与数据交互
  • 多镜头视频生成、机器人抓取、扩散模型个性化 | Big Model weekly第58期
  • (KTransformers) RTX4090单卡运行 DeepSeek-R1 671B
  • 探索紧急灾难处理的智慧:基于Neo4j的知识图谱问答系统
  • 【XSS】DVWA靶场XSS攻击
  • 进度条 —— 第一个linux程序
  • 我更新啦!纯手工编写C++画图,有注释!
  • 【JavaEE】-- 多线程(初阶)3
  • DeepSeek-R1 如何凭联网优势登顶智创聚合 API 模型使用榜首
  • Windows 10 远程桌面连接使用指南
  • 分光器的光衰计算公式。
  • 网站开发与设计这么样/seo优化诊断
  • 全国企业信息官网网站/seo排名点击工具
  • 临朐做网站的/链接交换公司
  • 学术网站建设/广州抖音推广公司
  • 深圳个人如何做网站设计/软文代发平台
  • 公司备案的网站被别的公司盗用/百度搜索排名机制