当前位置：首页 > news >正文

二分类交叉熵损失

news 2025/10/14 3:57:04

二分类交叉熵损失（Binary Cross-Entropy Loss）是用于二分类问题的常见损失函数。它衡量的是模型输出的预测概率分布与真实标签之间的差异。

1 二分类问题

在二分类问题中，每个样本的目标输出是 0 或 1，表示样本属于某一类或另一类。例如，假设我们有一个分类任务，模型的输出是某个样本属于类别 1 的概率： $\hat{y}$ ，而类别 0 的概率就是 $1 - \hat{y}$ 。

2. 交叉熵损失公式

对于一个单独的样本，二分类交叉熵损失可以表示为：

$L(y, \hat{y}) = -[y \cdot \log(\hat{y}) + (1 - y) \cdot \log(1 - \hat{y})]$

其中：

y是真实标签，取值为 0 或 1。

$\hat{y}$ 是模型预测的类别 1 的概率，通常通过 Sigmoid 函数计算得到，输出的值在 [0, 1] 之间。

3. 损失函数解释

如果真实标签 y=1，则损失函数变为 $L(y, \hat{y}) = -\log(\hat{y})$ ，即当预测的概率 $\hat{y}$ 越接近 1 时，损失越小，越接近 0 时，损失越大。
如果真实标签 y=0，则损失函数变为 $L(y, \hat{y}) = -\log(1 - \hat{y})$ ，即当预测的概率 $\hat{y}$ 越接近 0 时，损失越小，越接近 1 时，损失越大。

因此，二分类交叉熵损失的目标是：

如果真实标签是 1，模型要尽量预测一个接近 1 的概率。
如果真实标签是 0，模型要尽量预测一个接近 0 的概率。

4. 平均损失

对于多个样本，我们通常计算平均损失：

$L = \frac{1}{N} \sum_{i=1}^{N} \left[ - y_i \log(y_i) - (1 - y_i) \log(1 - y_i) \right]$

其中 N= 是样本的数量， $y_i$ 是第 iii 个样本的真实标签， $\hat{y}_i$ 是第 i个样本的预测概率。

5. Sigmoid函数与交叉熵

在二分类中，通常我们先通过 Sigmoid 函数将模型的输出（通常是一个实数）转换为概率值 $\hat{y}$ 。Sigmoid函数的公式如下：

$\hat{y} = \sigma(z) = \frac{1}{1 + e^{-z}}$

http://www.dtcms.com/a/109566.html

相关文章：

在内网环境中为 Gogs 配置 HTTPS 访问

常用的元素操作API

chromium魔改——navigator.webdriver 检测

【无人机】无人机PX4飞控系统高级软件架构

创新项目实训开发日志1

21.数据链路层协议

如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡1上面运行推理，并开启api服务

QT 中的元对象系统(五)：QMetaObject::invokeMethod的使用和实现原理

JavaScript基础-移动端常用开发框架

智能多媒体处理流水线——基于虎跃办公API的自动化解决方案

Redis 除了数据类型外的核心功能的详细说明，包含事务、流水线、发布/订阅、Lua 脚本的完整代码示例和表格总结

【数据集】多视图文本数据集

Python第七章09：自定义python包.py

maven引入项目内本地包方法

WEB安全--文件上传漏洞--php伪协议的利用

MySQL索引(操作篇)

分布式锁之redis6

GenerationMixin：_sample方法(GenerationMode.SAMPLE, GenerationMode.GREEDY_SEARCH)

程序员学商务英语之Establing Biz Relations Inquiry

自适应卡尔曼滤波

探索 GitHub Copilot：当 AI 成为你的贴身编码助手

Win11本地从零开始部署dify全流程

TP6图片操作 Image::open 调用-＞save(）方法时候报错Type is not supported

Redis基础知识-3

linux - 字符设备驱动简介

MySql 数据库题目

三防笔记本有什么用 | 三防笔记本有什么特别

CentOS中挂载新盘LVM指南：轻松扩展存储空间，解决磁盘容量不足问题

ORM mybits mybits-plus

探索现代网络技术：从负载均衡到 Kubernetes