图像分类精度评价的方法——误差矩阵、总体精度、用户精度、生产者精度、Kappa 系数
本文详细介绍 “图像分类精度评价的方法”。
图像分类后,需要评估分类结果的准确性,以判断分类器的性能和结果的可靠性。
常涉及到下面几个概念(指标) 误差矩阵、总体精度、用户精度、生产者精度和 Kappa 系数。
1. 误差矩阵(Error Matrix / Confusion Matrix)
误差矩阵是一个 n×nn \times nn×n 的矩阵,用于显示分类结果与实际地面真实数据的对应关系。
- nnn 表示类别数量。
- 矩阵的行表示分类结果(分类图像),列表示真实类别(地面调查数据)。
示意:
分类\实际 | 类别1 | 类别2 | … | 类别n |
---|---|---|---|---|
类别1 | x11x_{11}x11 | x12x_{12}x12 | … | x1nx_{1n}x1n |
类别2 | x21x_{21}x21 | x22x_{22}x22 | … | x2nx_{2n}x2n |
… | … | … | … | … |
类别n | xn1x_{n1}xn1 | xn2x_{n2}xn2 | … | xnnx_{nn}xnn |
- 对角线元素 xiix_{ii}xii 表示分类正确的像元数。
- 非对角线元素表示分类错误的像元数。
2. 总体精度(Overall Accuracy, OA)
定义:
总体精度表示分类正确的像元占总像元的比例,是最直观的精度指标。
公式:
OA=∑i=1nxiiN OA = \frac{\sum_{i=1}^{n} x_{ii}}{N} OA=N∑i=1nxii
其中:
- xiix_{ii}xii 为对角线元素(分类正确的像元数)
- NNN 为总像元数 N=∑i=1n∑j=1nxijN = \sum_{i=1}^{n} \sum_{j=1}^{n} x_{ij}N=∑i=1n∑j=1nxij
示例:如果总像元 1000 个,对角线上正确分类像元 850 个,则总体精度为:
OA=8501000=0.85 (85%) OA = \frac{850}{1000} = 0.85 \, (85\%) OA=1000850=0.85(85%)
3. 用户精度(User’s Accuracy, UA)
定义:
用户精度表示地图上某一类别像元被正确分类的概率,也叫“可靠度”。
公式:
UAi=xii∑j=1nxij UA_i = \frac{x_{ii}}{\sum_{j=1}^{n} x_{ij}} UAi=∑j=1nxijxii
- 分母是该行总数(分类为类别 iii 的像元总数)
- 分子是该行的对角线元素(正确分类的像元数)
例子:若分类为“水体”的像元总数为 200,其中真实为水体的 180 个:
UA水体=180200=0.9 (90%) UA_{\text{水体}} = \frac{180}{200} = 0.9 \, (90\%) UA水体=200180=0.9(90%)
4. 生产者精度(Producer’s Accuracy, PA)
定义:
生产者精度表示地面某一类别像元被正确分类的概率,也叫“遗漏误差”。
公式:
PAi=xii∑j=1nxji PA_i = \frac{x_{ii}}{\sum_{j=1}^{n} x_{ji}} PAi=∑j=1nxjixii
- 分母是该列总数(实际属于类别 iii 的像元总数)
- 分子是对角线元素(正确分类的像元数)
例子:若实际水体像元 190 个,正确分类为水体的 180 个:
PA水体=180190≈0.947 (94.7%) PA_{\text{水体}} = \frac{180}{190} \approx 0.947 \, (94.7\%) PA水体=190180≈0.947(94.7%)
5. Kappa 系数(Kappa Coefficient, κ\kappaκ)
定义:
Kappa 系数衡量分类精度与随机分类精度的偏差,是一个综合精度指标。
公式:
κ=N∑i=1nxii−∑i=1n(xi+⋅x+i)N2−∑i=1n(xi+⋅x+i) \kappa = \frac{N \sum_{i=1}^{n} x_{ii} - \sum_{i=1}^{n} (x_{i+} \cdot x_{+i})}{N^2 - \sum_{i=1}^{n} (x_{i+} \cdot x_{+i})} κ=N2−∑i=1n(xi+⋅x+i)N∑i=1nxii−∑i=1n(xi+⋅x+i)
其中:
- xi+=∑j=1nxijx_{i+} = \sum_{j=1}^{n} x_{ij}xi+=∑j=1nxij(行总数)
- x+i=∑j=1nxjix_{+i} = \sum_{j=1}^{n} x_{ji}x+i=∑j=1nxji(列总数)
- NNN 为总像元数
解释:
- κ=1\kappa = 1κ=1:完全一致
- κ=0\kappa = 0κ=0:与随机分类一致
- 一般分类的 κ>0.75\kappa > 0.75κ>0.75 表示精度很好
总结表格
指标 | 公式 | 作用 |
---|---|---|
总体精度 OA | OA=∑xiiNOA = \frac{\sum x_{ii}}{N}OA=N∑xii | 衡量整体分类正确率 |
用户精度 UA | UAi=xii∑jxijUA_i = \frac{x_{ii}}{\sum_j x_{ij}}UAi=∑jxijxii | 地图使用者视角,分类可靠度 |
生产者精度 PA | PAi=xii∑jxjiPA_i = \frac{x_{ii}}{\sum_j x_{ji}}PAi=∑jxjixii | 分类器视角,识别能力 |
Kappa 系数 κ\kappaκ | κ=N∑xii−∑xi+x+iN2−∑xi+x+i\kappa = \frac{N\sum x_{ii} - \sum x_{i+}x_{+i}}{N^2 - \sum x_{i+}x_{+i}}κ=N2−∑xi+x+iN∑xii−∑xi+x+i | 综合精度指标,考虑随机一致性 |