当前位置: 首页 > news >正文

图像质量评价(Image Quality Assessment,IQA)

文章目录

  • 图像质量评价(Image Quality Assessment,IQA)
  • 一、评估方式:主观评估 + 客观评估
    • 1.1、主观评估方式
    • 1.2、客观评估方式:全参考 + 半参考 + 无参考
      • (1)全参考的方法对比(Full-Reference IQA,FR-IQA)
      • (2)半参考的方法对比(Reduced-Reference IQA,RR-IQA)
      • (3)无参考的方法对比(No-Reference / Blind IQA,NR-IQA)
    • 1.3、常用公开IQA数据集对比表

图像质量评价(Image Quality Assessment,IQA)

图像质量评价指标(Image Quality Assessment, IQA)是衡量图像在主观感受或客观性能上的一组量化标准,常用于图像增强、压缩、重建、去噪等任务的效果评估。

图像质量评估:维基百科
图像质量评价:百度百科
图像质量评价(每个方法的论文简介与链接)

图像质量评估综述

  • 质量评估可分为:
    • 图像质量评估IQA
    • 视频质量评估VQA
  • IQA方法从宏观上可分为:
    • 主观评价:依赖人工评分,尽管准确性高、符合人眼视觉系统(HVS)偏好,但成本昂贵、效率低下,难以适配大规模自动化系统。
    • 客观评价:则以数学模型自动预测图像质量,广泛应用于工业与科研领域,是当前主流研究方向。
  • 从参考图像可用性角度,IQA又分为三类:
    • FR-IQA(全参考):借助无失真参考图像,计算其与原始图像的差异方法成熟、性能稳定,但对实际应用受限(因多数情况下参考图像缺失)。
    • RR-IQA(半参考):只有原始图像的部分信息或从参考图像中提取的部分特征在性能与适用性之间折中。
    • NR-IQA(无参考):仅依赖待评估图像本身,不需要参考图像应用最广但难度最大,当前是研究热点。

一、评估方式:主观评估 + 客观评估

评估方式简介特点与对比维度
主观评估(Subjective IQA)基于真实观察者的视觉感知,由人类主观对图像质量进行评分,常用指标包括MOS(平均意见得分)与DMOS(差异意见得分)。需要通过标准化实验环境和统计方法获取大量人评分。- ✅ 精度最高,最符合人眼感知
- ❌ 可复现性差,结果易受主观因素干扰
- ❌ 成本高,需招募被试并控制实验环境
- ❌ 实时性差,无法快速得出结果
- ❌ 难以部署,通常用于数据库标注与模型基准
客观评估(Objective IQA)通过数学模型或算法自动估算图像质量分数,目标是尽可能逼近主观得分,具有可重复性和实时性。根据参考图像的使用程度分为FR(全参考)、RR(半参考)、NR(无参考)三类,是当前研究热点。- ✅ 可复现、稳定性强
- ✅ 成本低,自动处理大规模图像
- ✅ 实时性好,支持在线或终端部署
- ✅ 可广泛应用于图像压缩、增强、采集质量控制等场景
- ⚠ 精度依赖模型质量,NR方法尤其具有挑战性

1.1、主观评估方式

方法类型简要说明评分输出应用场景
MOS(平均意见得分)多人打分后取平均分1 ~ 5 或 0 ~ 100训练NR-IQA模型,构建图像质量数据集
DMOS(差分MOS)与原始图像评分的差值,反映质量劣化程度通常为正数TID2013、CSIQ等主观差分数据集
单刺激法(SS)仅展示失真图像进行评分相对主观KonIQ-10k, LIVE Wild等
双刺激法(DSCQS)参考图与失真图并排显示,受试者对失真程度打分相对准确LIVE、CSIQ、TID系列
三选一法(3AFC)三图中选出质量最好/最差者,构建排序关系用于学习构造对比样本对DeepIQA排序训练等

1.2、客观评估方式:全参考 + 半参考 + 无参考

类别全称(英文)是否需要参考图像输入信息输出结果代表算法/模型常见评价指标常用数据集优势描述劣势描述典型应用场景
FR-IQAFull Reference IQA✅ 全参考原图 + 失真图两图之间的相似性得分PSNR、SSIM、MS-SSIM、FSIM、VIFPSNR, SSIM, MSELIVE, TID2013, CSIQ, KADID-10k精度高,计算逻辑清晰,结果可对齐主观感知依赖原图,实际部署难编解码优化、图像增强算法调试
RR-IQAReduced Reference IQA✅ 半参考失真图 + 原图特征或统计量与参考特征的相似性得分RRED、DNT、NRQM(部分)JS差异, KL散度, 差值指标TID2013, LIVE, SIQAD节省传输成本,精度优于NR,兼顾应用性与性能仍需传输部分特征,模型通用性不足视频传输评估、带宽受限下的图像监控
NR-IQANo Reference IQA / Blind IQA❌ 无参考单张失真图图像质量得分(预测值)BRISQUE、NIQE、PIQE、DeepBIQ、HyperIQA等MOS(主观分数)KonIQ-10k, SPAQ, CLIVE, LIVE Wild无需参考图,可用于实际图像质量预测部署难以保证泛化能力,训练依赖主观评分数据集医疗图像质检、无人监督场景

(1)全参考的方法对比(Full-Reference IQA,FR-IQA)

方法名核心指标是否模型训练主要思想优点缺点适用场景
MSE / PSNR均方误差 / 峰值信噪比逐像素差异/误差量度简单高效,便于实现不符合人眼感知;不具备感知鲁棒性压缩、编码等低层处理
SSIM结构相似度 Structural Similarity考察亮度、对比度与结构信息模拟视觉机制,感知一致性更好对几何变化、伪影不敏感编解码质量评估
MS-SSIM多尺度结构相似度多分辨率层次感知更贴近人眼感知层级计算略复杂高清视频/图像质量评价
VIF信息保真度 Visual Information Fidelity源图像/失真图像的信息量比率信息论基础,评价可靠性高理论复杂,耗时较长图像传输、压缩失真评估
FSIM特征相似度 Feature SIM考察相位一致性、梯度强度敏感性高,鲁棒性好不适合大规模计算图像增强质量评价
LPIPS感知相似度 Learned Perceptual Image Patch Similarity是(深度模型)提取CNN特征后计算相似度感知特性强,视觉一致性高模型依赖重、需GPU超分辨、风格迁移、图像复原等任务

(2)半参考的方法对比(Reduced-Reference IQA,RR-IQA)

方法名参考特征类型是否训练模型方法特点优点缺点适用场景
RRED局部统计量(DCT能量特征)基于变换域的熵率与视觉冗余度估计精度高,接近FR-IQA特征提取依赖参考图像,计算复杂通信系统图像质量反馈
DNT-RRDCT统计特征仅传输部分统计特征用于质量预测传输代价低,可嵌入实际系统失真类型覆盖范围有限网络图像编码传输
Wavelet-Q小波能量子带统计量局部频域统计特征构建质量指标可解释性强,计算高效对某些失真鲁棒性不足通信协议/嵌入式视频传输
RR-FSIM相位一致性+幅度统计特征对FSIM简化,只提取部分参考特征接近FR精度,传输成本低对特征选择依赖高视频会议、直播质量评估
RR-NSS自然场景统计参数利用自然图像统计模型压缩参考图像信息适应性强不适合非自然图像工业检测、远程图像识别等场景

(3)无参考的方法对比(No-Reference / Blind IQA,NR-IQA)

🚀 NR-IQA研究现状

  • 传统统计方法阶段(2010年以前)
    代表方法如BIQI、DIIVINE、BRISQUE等,依赖自然图像统计(NSS)特征,使用SVM或贝叶斯回归模型实现质量预测。该阶段研究具有可解释性强、计算代价低等优点,但泛化能力有限。
  • 数据驱动阶段(2013年起)
    随着深度学习发展,基于CNN的NR-IQA方法如CORNIA、NIMA、DeepBIQ等不断涌现,能够从图像中自动学习判别特征,主观一致性显著提升。此类方法在主观评分预测、跨数据库泛化等方面取得较好效果,但对数据依赖严重、可解释性差。
  • Transformer与自监督阶段(2020年至今)
    新一代方法引入Vision Transformer结构(如MANIQA、TReS、MUSIQ)或自监督学习(如CONTRIQUE),提升跨场景泛化能力与语义建模能力。当前最先进模型普遍在多个公开数据集(如LIVE、TID2013、KonIQ-10k、CLIVE等)上取得了优异成绩,开始接近甚至超过主观一致性下限。
方法名称首次提出模型类型特征类型是否训练适用失真类型主观一致性优点局限性应用场景
NIQE (Natural Image Quality Evaluator)2013传统统计模型NSS(自然场景统计)泛化失真(无需训练数据)中等无需训练、计算高效对特定失真不敏感,主观一致性不高快速筛选、质量控制
BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)2012SVM回归NSS特征(空域)模糊、压缩等常见失真轻量级、主观一致性较高需训练样本,失真类型受限通用图像评估
BLIINDS-II (Blind Image Integrity Notator using DCT Statistics)2011贝叶斯回归NSS(频域DCT)模糊、噪声等中等频域分析精细提取DCT特征耗时、训练依赖性视频压缩质量监测
CORNIA (Codebook Representation for No-Reference IQA)2013机器学习原始图块+无监督特征学习多种失真结合深层表示对内容敏感,训练成本高图像增强前后质量评估
HOSA (Higher Order Statistics Aggregation)2015无监督统计特征聚合(SVD+高阶矩)各类失真无需深度网络,适应性强参数敏感,训练集依赖医学图像质量分析
DIIVINE2011SVMNSS(空间+小波域)多类失真空间-频域联合特征维度高,训练成本大图像处理算法评估
IL-NIQE2015无监督NSS + 亮度不变性各类失真中等无训练集依赖,稳定性强泛化能力有限嵌入式图像监控设备
NIMA (Neural Image Assessment)2017CNN回归全图输入(Inception)主观美学/质量可预测MOS分布,美学兼顾训练代价高图像美学质量评分
DeepBIQ2016CNN分类+回归局部图块+深度特征泛化强利用深层特征,有效预测黑盒问题,计算量大手机拍照图像优化
RankIQA2017Siamese网络Siamese排序特征多类失真模拟评分过程,更接近人感知排序数据构建复杂图像优化排序任务
DBCNN2018CNN分类回归VGG16 + 评分网络各类失真精度高,可回归MOS需要大量数据通用图像质量评分
CONTRIQUE2021Transformer+NSSNSS嵌入 + 自监督学习泛化失真(无监督)利用NSS嵌入鲁棒性强网络复杂零样本质量估计
MANIQA2022Vision Transformer局部块 + 全局注意力泛化强极高高分辨率支持,跨数据集表现好模型参数多高端视觉质量分析

1.3、常用公开IQA数据集对比表

数据集名称类型图像数(参考/失真)失真类型主观评分特点简介
LIVE [官网]FR-IQA29 / 779模糊、压缩、噪声、快门抖动等5类DMOS最早最广泛使用的数据集之一;包含真实失真与评分,广泛用于FR-IQA评估基准。
CSIQ [官网]FR-IQA30 / 8666类失真×不同强度DMOS图像与失真类型更丰富;主观得分离散性较小;与LIVE互补。
TID2013 [官网]FR-IQA25 / 300024种失真×5级强度MOS非常全面的数据集;失真种类多,适合训练与泛化测试。
TID2008FR-IQA25 / 170017类失真MOSTID2013前身,失真较少但结构相似。
KADID-10k [官网]FR-IQA81 / 10,12525类失真×不同强度MOS图像种类多、失真复杂,适合深度学习模型训练。
CID2013FR-IQA474 / 474实拍设备失真MOS强调真实场景采集(拍照质量);图像尺寸大,适合真实感知建模。
Waterloo IAA [官网]FR-IQA4744 / 94,880常见压缩与噪声等失真无主观得分用于无参考方法的无监督训练或构造合成失真;大规模。
KonIQ-10k [官网]NR-IQA— / 10,073自然图像,真实失真MOS高分辨率自然图像;图像来源广泛,适合NR-IQA训练;包含多维质量因子标注。
CLIVE [官网]NR-IQA— / 1,162拍摄图像中自然失真MOS强调移动端/手持拍摄自然图像质量;适合盲质量评价建模。
SPAQ [论文]NR-IQA— / 11,125高质量自然失真图像MOS更具挑战性,真实感强;含曝光/色彩/对比等因素。
FLIVENR-IQA— / 39,000+自然采集图像MOS最大规模真实图像质量数据集之一,适用于深度NR-IQA模型训练。

📌 说明:

  • FR-IQA(Full Reference):提供参考图像与失真图像,可用于全参考算法对比。
  • NR-IQA(No Reference):无参考图像,难度更高,适合实际部署情境。
  • MOS/DMOS:主观评分标准,分别代表“平均意见分数”“差异平均意见分数”。
http://www.dtcms.com/a/282318.html

相关文章:

  • 【unitrix】 6.1 类型化整数特征(t_int.rs)
  • 深入理解-Java-线程池:原理、动态调整与监控实践
  • 牛市看涨期权的价差策略是什么?
  • mongoDB初始化项目简单操作示例
  • YAML 自动化用例中 GET vs POST 请求的参数写法差异
  • 部分排序算法的Java模拟实现(复习向,非0基础)
  • PostgreSQL数据库集群如何进行自动化性能监测?
  • HTML5》》template
  • (LeetCode 面试经典 150 题) 205. 同构字符串 (哈希表)
  • 针对 Python、Java、Go 的依赖树检测实现方案,包含漏洞扫描和依赖关系分析的核心代码与工具链
  • Chrome紧急更新,谷歌修复正遭活跃利用的关键零日漏洞
  • Java运维之Tomcat升级
  • 【c++深入系列】:万字详解list(附模拟实现的list源码)
  • Android 高通平台修改音频参数效果文件-优化音频效果
  • 如何使用 OpenCV 打开指定摄像头
  • 微服务变更?自动化测试利器Parasoft SOAtest修复快、准、稳!
  • 【微服务】Ocelot微服务网关
  • RL-马尔科夫过程、动态规划
  • 042_封装的实现(属性私有化 / 方法公开)
  • 网络基础10 长途互联--WAN广域网技术
  • fastadmin中ajax弹窗修改文字为英文
  • Taro.getRandomValues() 用法详解
  • 端侧推理软件栈
  • 搜索框的显示与隐藏(展开与收起)
  • 智能工厂生产设备状态检测算法
  • Navicat Premium17.2.8 下载与安装(免费版)
  • 数字万用表是什么?七位半数字万用表/多用表的核心指标应用及技术趋势?
  • 近期学习总结
  • ADS8331手册驱动开发
  • HTML基础知识 二(创建容器和表格)