混淆矩阵概念
从机器学习混淆矩阵角度
定义
TP、True Positive 真阳性:预测为正,实际也为正
FP、False Positive 假阳性:预测为正,实际为负
FN、False Negative 假阴性:预测与负、实际为正
TN、True Negative 真阴性:预测为负、实际也为负
预测和实际一致则为真,预测和实际不一致则为假;
预测出来是“正”的,则为“阳”,预测结果为 “负”,则为“阴”。
二分类:
三分类:
对A,B, C三个分类, 计算分类A的相关指标时候,可以理解为将B,C统一归位“非A“,等效为“A”和“非A”两个类别,转换为二分类了。
从医学角度说
定义
- 阳性(positive),代表患病
- 阴性(negative),代表正常
假阳性(false positive)是指因为种种原因把不具备阳性症状的人检测出阳性的结果。其实就是将没病的检查成有病的,假阳性检测结果易造成误诊,
假阴性(false negative)就是将有病的检查为没病,假阴性结果导致漏诊。
敏感度(sensitivity):又称真阳性率,即患者被诊断为阳性的概率,计算公式是:真阳性/(真阳性+假阴性)×100%,此值越大,说明诊断试验越灵敏。
特异度(specificity):又称真阴性率,即实际上未患病的人被诊断为阴性的概率,计算公式是:真阴性/(真阴性+假阳性)×100%,此值越大,说明诊断试验越精确。
参考资料:
阳性,阴性,假阳性,假阴性,敏感度,特异性
TP真阳性, FP假阳性, FN假阴性, TN真阴性
机器学习基础(一)混淆矩阵,真阳性(TP),真阴性(TN),假阳性(FP),假阴性(FN)以及敏感性(Sensitivity)和特异性(Specificity)