当前位置: 首页 > news >正文

Logistic Loss Function|逻辑回归代价函数

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、逻辑回归代价函数的定义

逻辑回归的代价函数(又称交叉熵损失)用于评估模型预测结果与真实标签之间的差异。不同于线性回归的均方误差,它专门针对分类问题设计,能够有效惩罚“高置信度的错误预测”,同时鼓励模型输出更接近真实标签的概率值。

通俗理解

想象老师在批改判断题:

  • 如果学生非常自信地答错(比如写“绝对选A”,但正确答案是B),老师会狠狠扣分。

  • 如果学生答对但不太确定(比如写“可能是A”),老师会适当给分。

  • 如果学生答对且很确定(比如写“肯定选A”),老师会给满分。
    代价函数的作用类似——让模型为自己的“盲目自信”付出代价,同时奖励正确且确定的预测


二、平方误差 vs 逻辑回归:代价函数的设计差异与凸性对比

D9B60E6B-55D5-4B89-9F81-494CE6188D22.png

这张图片展示了平方误差代价函数(Squared error cost)及其相关概念,主要分为以下几个部分:

  1. 平方误差代价函数公式

    4A1A1FAD-3159-48F4-BC9F-8AAC89BCD657.png

    用于衡量线性回归模型的预测值与真实值之间的误差。

  2. 损失函数(loss)

    21573285-44D4-48BC-BABF-EE48D78BC093.png

    表示单个样本的误差。

  3. 线性回归模型

    C8C4B714-C5DC-44D2-802F-9FCBE07ACEF5.png

    这是一个线性预测函数。

  4. 凸性与非凸性

    • 线性回归的代价函数 f(w,b) 是凸函数(convex),保证梯度下降能找到全局最优解。

    • 如果直接对逻辑回归使用平方误差,代价函数可能非凸(non-convex),导致优化困难。

  5. 逻辑回归的预测函数

    612B2053-923B-4A8C-A7F7-352D6A203753.png

    这是一个Sigmoid函数,将线性输出映射到概率(0, 1)。

图片的核心对比了线性回归(平方误差)逻辑回归(需用交叉熵损失)在代价函数设计上的差异。


三、逻辑回归代价函数公式

49D8EDA0-2B7C-43FC-B934-19D23F566A76.png

E0826B26-E1B3-4B88-A544-744548A1C88D.png

CF3FC85B-876D-4ED3-92DF-72D712EF171D.png

  1. 分段定义
    损失函数 L 根据真实标签 y(i) 的取值(0 或 1)分段计算:

    • 若 y(i)=1,损失为 −log⁡(fW,b(x⃗(i)))。

    • 若 y(i)=0,损失为 −log⁡(1−fW,b(x⃗(i)))。

  2. 损失变化趋势

    • 当预测值 fW,b(x⃗(i)) 接近真实标签时(如 y(i)=1 且 f→1),损失趋近于 0。

    • 当预测值与真实标签相反时(如 y(i)=1 但 f→0),损失趋近于无穷大。

  3. 核心作用
    损失函数通过对数惩罚机制,迫使模型对错误预测(尤其是高置信度错误)付出更高代价,从而推动参数优化。

  4. 优化目标
    通过调整参数 w⃗,b 最小化代价函数 J,使模型预测 fw⃗,b(x⃗) 尽可能接近真实标签 y。


四、逻辑回归损失函数的两种表达形式及其统一化

9E1D859F-394E-41A4-BAF2-44EB4705F760.png

629884A2-BA9C-4BA9-8600-01719C3D3537.png

  1. 第一幅图

    • 展示了逻辑回归损失函数从分段形式统一形式的简化过程。

    • 分段形式(直观但冗长):

      • 当 y=1,损失为 −log⁡(f(x))

      • 当 y=0,损失为 −log⁡(1−f(x))

    • 统一形式(紧凑且通用):

      CA82C261-E6ED-46DC-A3C1-46C9DB343766.png

    • 通过数学技巧将两种情况合并为一个公式,便于计算和优化。

  2. 第二幅图

    • 将单样本的损失函数推广到整体代价函数(所有样本的平均损失)。

    • 公式:

      C790BD27-85EC-4B46-9E62-706B4E09F154.png

    • 强调该函数是凸函数(convex),保证梯度下降能找到全局最优解。

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

http://www.dtcms.com/a/325394.html

相关文章:

  • 实习学习记录
  • 集成电路学习:什么是URDF Parser统一机器人描述格式解析器
  • ttyd终端工具移植到OpenHarmony
  • 工业相机与智能相机的区别
  • 5G与云计算对代理IP行业的深远影响
  • 用 Python 绘制企业年度财务可视化报告 —— 从 Excel 到 9 种图表全覆盖
  • nvm安装详细教程(卸载旧的nodejs,安装nvm、node、npm、cnpm、yarn及环境变量配置)
  • 论文中PDF的公式如何提取-公式提取
  • Lightroom 安卓版 + Windows 版 + Mac 版全适配,编辑管理一站式,专业摄影后期教程
  • 【实用案例】录音分片上传的核心逻辑和实现案例【文章附有代码】
  • 智能双行框!百度全量上线AI搜索,是革新浪潮还是昙花一现?
  • 场外个股期权交易系统全球解决方案:监管协同与流动性创新——基于香港LEAP框架与多级清算体系的实践验证
  • 腾讯 iOA 测评 | 横向移动检测、病毒查杀、外设管控、部署性能
  • 智能合约执行引擎在Hyperchain中的作用
  • 飞算 JavaAI 智能进阶:从技术工具到金融科技开发范式的革新
  • 能力评估:如何系统评估你的技能和经验
  • “人工智能 +”新政即将出台,哪些领域将迎来发展风口?
  • 论文学习22:UNETR: Transformers for 3D Medical Image Segmentation
  • IDE认知革命:JetBrains AI Assistant插件深度调教手册(终极实战指南)
  • @ContextConfiguration
  • Java基础结课题-统计双色球中奖数
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘lightgbm’问题
  • yolo目标检测技术之yolo1到yolo5(二)
  • Profile.vue组件详细解析
  • 缓存的三大问题分析与解决
  • 【运维进阶】WEB 服务器
  • Linux epoll:高并发网络编程的终极武器
  • Android Coil3视频封面抽取封面帧存Disk缓存,Kotlin
  • 自动化UI测试工具TestComplete的多语言引擎与内置实践
  • LabVIEW声波测井信号处理系统