神经网络八股(4)
1.分类问题常用的性能指标
准确率:所有样本中判别正确的比率
召回率:模型正确预测为正类的样本数与所有实际为正类的样本总数的比例
精确率:模型正确预测为正类的样本数与所有预测为正类的样本总数的比例。
F1-score:精确率(Precision)和召回率(Recall)的调和平均数
ROC:条以假正例率(FPR)为横轴,真正例率(TPR)为纵轴的曲线。通过调整分类阈值,我们可以得到一系列不同的FPR和TPR值,这些值在ROC图上形成的曲线即为ROC曲线。
AUC:ROC曲线的面积,AUC值越大,表示模型将正样本排在负样本前面的能力越强,即模型的分类性能越好。UC值的取值范围在0.5到1之间。当AUC值为0.5时,表示模型没有分类能力,即随机猜测;当AUC值接近1时,表示模型的分类性能非常好
Log-loss:对数回归损失也叫逻辑回归损或交叉熵损失。对数损失越小,表示模型的预测概率分布与实际标签概率分布越接近,模型性能越好