机器学习/深度学习 信号处理 评估指标速查表
机器学习/深度学习 & 信号处理 评估指标速查表
一、机器学习与深度学习指标
1. 分类任务
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 准确率 (Accuracy) | Accuracy=TP+TNTP+TN+FP+FNAccuracy = \frac{TP + TN}{TP + TN + FP + FN}Accuracy=TP+TN+FP+FNTP+TN | 类别分布均衡任务 | 直观但对不平衡数据失效 |
| 精确率 (Precision) | Precision=TPTP+FPPrecision = \frac{TP}{TP + FP}Precision=TP+FPTP | 需降低“误判正类”场景 | 关注“预测为正”的可靠性 |
| 召回率 (Recall) | Recall=TPTP+FNRecall = \frac{TP}{TP + FN}Recall=TP+FNTP | 需降低“漏判正类”场景 | 关注“实际为正”的捕捉能力 |
| F1-Score | F1=2×Precision×RecallPrecision+RecallF1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}F1=2×Precision+RecallPrecision×Recall | 类别不平衡、需平衡P/R | 调和平均,兼顾精确率与召回率 |
| AUC | ROC曲线下面积(横轴FPR=FPTN+FPFPR=\frac{FP}{TN+FP}FPR=TN+FPFP,纵轴RecallRecallRecall) | 评估模型泛化能力 | 取值0-1,越接近1性能越好 |
| 混淆矩阵 | 矩阵形式:[TNFPFNTP]\begin{bmatrix} TN & FP \\ FN & TP \end{bmatrix}[TNFNFPTP] | 所有分类任务 | 计算其他指标的基础,结果直观 |
| 宏平均/微平均 | 宏平均:1k∑i=1kMetrici\frac{1}{k}\sum_{i=1}^k Metric_ik1∑i=1kMetrici;微平均:∑i=1kTPi∑i=1k(TPi+FPi)\frac{\sum_{i=1}^k TP_i}{\sum_{i=1}^k (TP_i + FP_i)}∑i=1k(TPi+FPi)∑i=1kTPi | 多分类任务 | 宏平均侧重类别公平,微平均侧重样本公平 |
2. 回归任务
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 均方误差 (MSE) | MSE=1n∑i=1n(yi−y^i)2MSE = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2MSE=n1∑i=1n(yi−y^i)2 | 连续值预测,关注平方偏差 | 对异常值敏感,值越小越好 |
| 均方根误差 (RMSE) | RMSE=1n∑i=1n(yi−y^i)2RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2}RMSE=n1∑i=1n(yi−y^i)2 | 需误差单位与原数据一致 | 解决MSE单位平方问题,更易理解实际偏差 |
| 平均绝对误差 (MAE) | MAE=1n∑i=1n∣yi−y^i∣MAE = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|MAE=n1∑i=1n∣yi−y^i∣ | 需降低异常值影响 | 对异常值鲁棒,偏差呈线性 |
| 决定系数 (R²) | R2=1−∑i=1n(yi−y^i)2∑i=1n(yi−yˉ)2R^2 = 1 - \frac{\sum_{i=1}^n (y_i - \hat{y}_i)^2}{\sum_{i=1}^n (y_i - \bar{y})^2}R2=1−∑i=1n(yi−yˉ)2∑i=1n(yi−y^i)2 | 评估模型解释力 | 取值0-1,越接近1拟合效果越好 |
3. 聚类任务
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 轮廓系数 | s(i)=b(i)−a(i)max(a(i),b(i))s(i) = \frac{b(i) - a(i)}{\max(a(i), b(i))}s(i)=max(a(i),b(i))b(i)−a(i),其中a(i)a(i)a(i)为簇内平均距离,b(i)b(i)b(i)为最近簇平均距离 | 无标签聚类效果评估 | 取值-1-1,越接近1聚类越优 |
| 兰德指数 (RI) | RI=TP+TNCn2RI = \frac{TP + TN}{C_n^2}RI=Cn2TP+TN,其中Cn2C_n^2Cn2为总样本对数量 | 有真实标签的聚类验证 | 取值0-1,与真实分类吻合度越高越好 |
| 标准化互信息 (NMI) | NMI=I(X;Y)H(X)H(Y)NMI = \frac{I(X;Y)}{\sqrt{H(X)H(Y)}}NMI=H(X)H(Y)I(X;Y),其中I(X;Y)I(X;Y)I(X;Y)为互信息,HHH为熵 | 衡量聚类与真实标签相关性 | 取值0-1,值越大相关性越强 |
4. 生成模型
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| Inception Score (IS) | $IS = \exp\left( \mathbb{E}_{x \sim p_g} [KL(p(y | x) \parallel p(y))] \right)$ | 生成图像质量/多样性评估 |
| FID | FID=∣μr−μg∣2+Tr(Σr+Σg−2ΣrΣg)FID = | \mu_r - \mu_g |^2 + \text{Tr}(\Sigma_r + \Sigma_g - 2\sqrt{\Sigma_r \Sigma_g})FID=∣μr−μg∣2+Tr(Σr+Σg−2ΣrΣg),其中μ\muμ为均值,Σ\SigmaΣ为协方差 | 生成样本分布匹配度评估 | 值越小,与真实样本分布越接近 |
| GAN Precision/Recall | Precision=1Ng∑xg∼pgI(xg∈Sr)Precision = \frac{1}{N_g} \sum_{x_g \sim p_g} \mathbb{I}(x_g \in S_r)Precision=Ng1∑xg∼pgI(xg∈Sr);Recall=1Nr∑xr∼prI(xr∈Sg)Recall = \frac{1}{N_r} \sum_{x_r \sim p_r} \mathbb{I}(x_r \in S_g)Recall=Nr1∑xr∼prI(xr∈Sg) | 生成样本真实性/覆盖度评估 | P高=真实感强,R高=多样性好 |
二、信号处理指标
1. 信号相似度与失真度
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 均方误差 (MSE) | MSE=1N∑k=1N(xorig(k)−xproc(k))2MSE = \frac{1}{N} \sum_{k=1}^N (x_{\text{orig}}(k) - x_{\text{proc}}(k))^2MSE=N1∑k=1N(xorig(k)−xproc(k))2 | 信号幅值偏差评估 | 值越小,信号失真越小 |
| 信噪比 (SNR) | SNR=10log10(PsignalPnoise)(dB)SNR = 10 \log_{10} \left( \frac{P_{\text{signal}}}{P_{\text{noise}}} \right) \quad (\text{dB})SNR=10log10(PnoisePsignal)(dB) | 信号质量评估(降噪后) | 单位dB,值越大,噪声越少、信号越清晰 |
| 峰值信噪比 (PSNR) | PSNR=10log10(MAXI2MSE)(dB)PSNR = 10 \log_{10} \left( \frac{MAX_I^2}{MSE} \right) \quad (\text{dB})PSNR=10log10(MSEMAXI2)(dB),其中MAXIMAX_IMAXI为信号峰值 | 图像、音频信号失真评估 | 值越大,视觉/听觉失真越小 |
| 相关系数 | ρ=Cov(x,y)Var(x)⋅Var(y)\rho = \frac{\text{Cov}(x,y)}{\sqrt{\text{Var}(x) \cdot \text{Var}(y)}}ρ=Var(x)⋅Var(y)Cov(x,y) | 两信号线性相关性匹配 | 取值-1-1,越接近1线性相关性越强 |
| 动态时间规整 (DTW) | DTW(X,Y)=min∑i,jd(xi,yj)⋅wi,jDTW(X,Y) = \min \sum_{i,j} d(x_i,y_j) \cdot w_{i,j}DTW(X,Y)=min∑i,jd(xi,yj)⋅wi,j,其中ddd为距离,www为路径权重 | 长度/节奏不同的时序匹配 | 值越小,时序信号相似度越高 |
2. 频率与谱分析
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 功率谱密度 (PSD) | $PSD(f) = \lim_{T \to \infty} \frac{1}{T} \left | X_T(f) \right | ^2,其中,其中,其中X_T(f)为信号为信号为信号x(t)$的短时傅里叶变换 |
| 谱熵 | SE=−∑m=1MP(m)log2P(m)SE = -\sum_{m=1}^M P(m) \log_2 P(m)SE=−∑m=1MP(m)log2P(m),其中P(m)P(m)P(m)为功率谱归一化概率 | 信号频率分布均匀性分析 | 熵值越大,频率分布越均匀、信号越复杂 |
| 信噪比改善量 | ΔSNR=SNRpost−SNRpre\Delta SNR = SNR_{\text{post}} - SNR_{\text{pre}}ΔSNR=SNRpost−SNRpre | 降噪算法性能评估 | 值越大,降噪效果越好 |
3. 信号检测与识别
| 指标名称 | 核心公式(LaTeX+领域符号) | 适用场景 | 关键特点 |
|---|---|---|---|
| 检测概率 (P_d) | Pd=Ndet,trueNsignal,trueP_d = \frac{N_{\text{det,true}}}{N_{\text{signal,true}}}Pd=Nsignal,trueNdet,true | 信号检测任务 | 值越大,检测能力越强 |
| 虚警概率 (P_fa) | Pfa=Ndet,falseNsignal,falseP_{fa} = \frac{N_{\text{det,false}}}{N_{\text{signal,false}}}Pfa=Nsignal,falseNdet,false | 检测算法可靠性评估 | 值越小,算法误判率越低、越可靠 |
| 识别准确率 | Acc=Nrec,trueNtotalAcc = \frac{N_{\text{rec,true}}}{N_{\text{total}}}Acc=NtotalNrec,true | 信号调制/类型识别 | 与分类准确率一致,直接反映识别效果 |
