当前位置: 首页 > news >正文

二分类交叉熵损失

二分类交叉熵损失(Binary Cross-Entropy Loss)是用于二分类问题的常见损失函数。它衡量的是模型输出的预测概率分布与真实标签之间的差异。


1 二分类问题

在二分类问题中,每个样本的目标输出是 0 或 1,表示样本属于某一类或另一类。例如,假设我们有一个分类任务,模型的输出是某个样本属于类别 1 的概率 :\hat{y},而类别 0 的概率就是 1 - \hat{y}

2. 交叉熵损失公式

对于一个单独的样本,二分类交叉熵损失可以表示为:

L(y, \hat{y}) = -[y \cdot \log(\hat{y}) + (1 - y) \cdot \log(1 - \hat{y})]

其中:

y是真实标签,取值为 0 或 1。

\hat{y}是模型预测的类别 1 的概率,通常通过 Sigmoid 函数计算得到,输出的值在 [0, 1] 之间。

3. 损失函数解释

  • 如果真实标签 y=1,则损失函数变为L(y, \hat{y}) = -\log(\hat{y}),即当预测的概率 \hat{y}越接近 1 时,损失越小,越接近 0 时,损失越大。

  • 如果真实标签 y=0,则损失函数变为L(y, \hat{y}) = -\log(1 - \hat{y}),即当预测的概率 \hat{y}越接近 0 时,损失越小,越接近 1 时,损失越大。

因此,二分类交叉熵损失的目标是:

  • 如果真实标签是 1,模型要尽量预测一个接近 1 的概率。

  • 如果真实标签是 0,模型要尽量预测一个接近 0 的概率。

4. 平均损失

对于多个样本,我们通常计算平均损失:

L = \frac{1}{N} \sum_{i=1}^{N} \left[ - y_i \log(y_i) - (1 - y_i) \log(1 - y_i) \right]

其中 N= 是样本的数量,y_i是第 iii 个样本的真实标签,\hat{y}_i是第 i个样本的预测概率。

5. Sigmoid函数与交叉熵

在二分类中,通常我们先通过 Sigmoid 函数将模型的输出(通常是一个实数)转换为概率值 \hat{y}。Sigmoid函数的公式如下:

\hat{y} = \sigma(z) = \frac{1}{1 + e^{-z}}

http://www.dtcms.com/a/109566.html

相关文章:

  • 在内网环境中为 Gogs 配置 HTTPS 访问
  • 常用的元素操作API
  • chromium魔改——navigator.webdriver 检测
  • 【无人机】无人机PX4飞控系统高级软件架构
  • 创新项目实训开发日志1
  • 21.数据链路层协议
  • 如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡1上面运行推理,并开启api服务
  • QT 中的元对象系统(五):QMetaObject::invokeMethod的使用和实现原理
  • JavaScript基础-移动端常用开发框架
  • 智能多媒体处理流水线——基于虎跃办公API的自动化解决方案
  • Redis 除了数据类型外的核心功能 的详细说明,包含事务、流水线、发布/订阅、Lua 脚本的完整代码示例和表格总结
  • 【数据集】多视图文本数据集
  • Python第七章09:自定义python包.py
  • maven引入项目内本地包方法
  • WEB安全--文件上传漏洞--php伪协议的利用
  • MySQL索引(操作篇)
  • 分布式锁之redis6
  • GenerationMixin:_sample方法(GenerationMode.SAMPLE, GenerationMode.GREEDY_SEARCH)
  • 程序员学商务英语之Establing Biz Relations Inquiry
  • 自适应卡尔曼滤波
  • 探索 GitHub Copilot:当 AI 成为你的贴身编码助手
  • Win11本地从零开始部署dify全流程
  • TP6图片操作 Image::open 调用->save()方法时候报错Type is not supported
  • Redis基础知识-3
  • linux - 字符设备驱动简介
  • MySql 数据库题目
  • 三防笔记本有什么用 | 三防笔记本有什么特别
  • CentOS中挂载新盘LVM指南:轻松扩展存储空间,解决磁盘容量不足问题
  • ORM mybits mybits-plus
  • 探索现代网络技术:从负载均衡到 Kubernetes