当前位置: 首页 > news >正文

影像生成评估指标FID

一、FID 介绍

FID 是 Fréchet Inception Distance 的缩写,中文常称 “弗雷歇・因 ception 距离”,核心是衡量生成影像与真实影像的分布相似度,数值越低代表生成效果越贴近真实数据。

关键原理

  1. 用预训练的 Inception-v3 网络提取影像的高维特征(聚焦语义和全局结构)。

  2. 假设两组特征都服从多元高斯分布,分别计算各自的均值和协方差矩阵。

  3. 计算两个高斯分布之间的 Fréchet 距离,该距离即为 FID 值。

二、计算过程

  1. 数据准备:明确两组数据 —— 真实影像集(如 ImageNet 真实图片)和生成影像集(如 GAN 生成的图片),两组数据需保持相同分辨率、通道数(如均为 256×256 彩色图)。

  2. 特征提取:用预训练的 Inception-v3 网络(去掉最后一层分类层),分别对两组影像提取高维特征向量(通常是 2048 维),聚焦影像的全局结构和语义信息(如 “是否有猫的轮廓”“色彩分布是否自然”)。

  3. 分布拟合:假设两组特征向量都服从 多元高斯分布,分别计算:

    • 真实特征的均值向量(μ_real)和协方差矩阵(Σ_real)

    • 生成特征的均值向量(μ_gen)和协方差矩阵(Σ_gen)

  4. 计算 Fréchet 距离:代入公式计算两个高斯分布的距离,结果即为 FID 值:FID = ||μ_real - μ_gen||² + Tr (Σ_real + Σ_gen - 2√(Σ_realΣ_gen))(||・||² 是欧氏距离的平方,Tr 是矩阵的迹,即对角线元素之和)

三、数值与标准

FID 值越小,代表真实与生成影像的分布越接近,生成效果越好。

  • 优秀生成模型(如成熟扩散模型):FID < 10(贴近真实数据)

  • 良好模型:10 < FID < 30(结构和语义基本一致)

  • 一般模型:30 < FID < 50(存在明显差异,如结构扭曲、色彩怪异)

  • 较差模型:FID > 50(生成内容与真实数据偏差极大)

生成影像集至少需要 1000 张图片,否则协方差矩阵估计不准,FID 值会失真

http://www.dtcms.com/a/531907.html

相关文章:

  • 【金仓数据库】ksql 指南(三) —— 创建与管理表空间和模式
  • 高并发内存池 - 开发记录07
  • 品牌网站建设平台杭州排名优化公司
  • 做网站用的笔记本配置检测asp网站死循环
  • 建材公司网站建设方案金融网站建设方案ppt
  • 零基础从头教学Linux(Day 56)
  • 世冠科技2025复杂装备数智化研发与运维技术研讨会暨 GCKontrol GCAir 10.0 版本产品发布会圆满落幕
  • Qt6 学习——一个Qt桌面应用程序
  • 【Linux】传输层协议TCP
  • 前端监控:错误捕获与行为日志全解析
  • 第一部分:网络基础
  • Socket详解
  • Ceph存储
  • [人工智能-大模型-87]:模型层技术 - “神经网络架构演进的全景地图”,“从简单到复杂、从单一到智能” - 通俗易懂版。
  • windows 2003 取消网站访问密码wordpress黑镜百度云盘
  • Spring Boot3零基础教程,自定义 starter,把项目封装成依赖给别人使用,笔记65
  • 建设足球网站的心得和意义渠道分销管理系统
  • 【PLC】汇川InoTouchPad在Win11上显示太小
  • OpenHarmony蓝牙技术全解析:从设备发现到数据传输的完整流程
  • 解压版MySQL的安装与卸载
  • C++编程基础(五):字符数组和字符串
  • 在线旅游网站平台有哪些山东泰安房价2023最新价格
  • [3D Max 基础知识分享]—多孔结构模型编辑
  • 【C++篇】C++11入门:踏入C++新世界的大门
  • 爬虫数据清洗可视化案例之全球灾害数据
  • QT(c++)开发自学笔记:4.Qt 3D简易实现
  • Vue3 自定义事件
  • 上海住房和城乡建设厅网站个人备案网站可以做产品推广
  • Android OpenGLES视频剪辑示例源码
  • 做淘宝客导购网站推广wordpress 明星