当前位置: 首页 > news >正文

逻辑回归(Logistic Regression)模型的概率预测函数

以二分类问题为例,常见的损失函数有

  • 负对数似然损失(neg log-likelihood loss),
  • 交叉熵损失(cross entropy loss),
  • deviance loss
  • 指数损失(exponential loss)。

前三者虽然名字不同,但却具有相同的表达形式。此外,neg log-likelihood loss 和 exponential loss在期望意义下具有相同的解

逻辑回归(Logistic Regression)

逻辑回归是最常见的分类模型,具有如下形式:
在这里插入图片描述
图片展示的是 逻辑回归(Logistic Regression)模型的概率预测函数,它是机器学习中经典的二分类算法核心公式。以下是详细解析:


1. 公式组成

p ( x ; ω , b ) = σ ( ω T x + b ) = 1 1 + e − ( ω T x + b ) p(x; \omega, b) = \sigma(\omega^T x + b) = \frac{1}{1 + e^{-(\omega^T x + b)}} p(x;ω,b)=σ(ωTx+b)=1+e(ωTx+b)1

  • 输入

    • ( x ): 特征向量(如图像特征、用户行为数据等)。
    • ( ω \omega ω ): 权重向量(模型需要学习的参数)。
    • ( b ): 偏置项(截距)。
  • 输出

    • ( p(x; ω \omega ω, b) ): 样本 ( x ) 属于类别1的概率(范围0到1)。
  • 关键函数

    • Sigmoid函数(σ):将线性组合 ω T x + b \omega^T x + b ωTx+b 映射到概率空间。
      def sigmoid(z):
          return 1 / (1 + np.exp(-z))
      

2. 逻辑回归的核心思想

  • 本质:通过线性回归 + Sigmoid激活函数,实现二分类概率预测。
  • 决策规则
    • 若 ( p(x) \geq 0.5 ),预测为类别1;
    • 若 ( p(x) < 0.5 ),预测为类别0。

3. 逻辑回归的BCE损失

  • 逻辑回归通常使用**二元交叉熵(BCE)**作为损失函数,而Focal BCE是对BCE的改进,用于处理类别不平衡问题。
    # 逻辑回归的BCE损失
    loss = -[y * log(p) + (1-y) * log(1-p)]
    

损失函数设计举例
在这里插入图片描述


4. 参数学习(θ = (b, ω))

  • 优化目标:通过梯度下降最小化交叉熵损失,调整 ( ω \omega ω ) 和 ( b )。
  • 学习过程
    ω ← ω − η ⋅ ∂ L ∂ ω , b ← b − η ⋅ ∂ L ∂ b \omega \leftarrow \omega - \eta \cdot \frac{\partial \mathcal{L}}{\partial \omega}, \quad b \leftarrow b - \eta \cdot \frac{\partial \mathcal{L}}{\partial b} ωωηωL,bbηbL
    • ( η \eta η ): 学习率
    • ( L \mathcal{L} L ): 损失函数(如BCE)

5. 为什么用Sigmoid?

  • 概率压缩:将线性输出 ( ω T \omega^T ωT x + b ) 映射到 (0,1) 区间,符合概率定义。
  • 可解释性:输出可直接解释为“属于正类的置信度”。

总结

逻辑回归的概率函数,它是:

  1. 二分类模型的基础;
  2. 通过Sigmoid函数输出概率;
  3. 常与交叉熵损失配合使用(可扩展为Focal BCE处理不平衡数据)。
http://www.dtcms.com/a/99741.html

相关文章:

  • Gateway实战(一)、网关基本了解、配置路由案例实操
  • YOLOv8环境配置及依赖安装过程记录
  • 爬虫工程师分享自动批量化获取商品评论数据的方法有哪些?
  • Linux中CP到一半不小心kill了能恢复吗?
  • SAP SD学习笔记36 - BackOrder(延期交货订单处理)
  • Stable Diffusion太慢?国内Midjourney平替方案—商用合规部署
  • AI Agent开发大全第十四课-零售智能导购智能体的RAG开发理论部分
  • 从分布式系统架构看LPL饭圈生态:开发者视角下的博弈平衡与演化逻辑
  • 【vue】聊一聊拖拽改变DOM大小的实现
  • Redis场景问题2:缓存击穿
  • VMware笔记之windows的vmware17pro中的ubuntu22.04调整系统空间大小
  • C#里实现C#脚本单步执行的信息提示
  • 算法 之 求解有向图和无向图的环的长度
  • CSS学习笔记4——盒子模型
  • IO模型之于并发编程模型、并发模型之于架构模式
  • 破界·共生:生成式人工智能(GAI)认证重构普通人的AI进化图谱
  • SpringCould微服务架构之Docker(6)
  • 【C#】C#字符串拼接的6种方式及其性能分析对比
  • Axure项目实战:智慧运输平台后台管理端-货主管理(中继器)
  • 21 python __name__ 与 __main__
  • Java中的String类
  • 智能巡检机器人:2025年企业安全运维的“数字哨兵“
  • Vue 3 中 slot插槽的使用方法
  • 最大子序和 买股票的最佳时机|| 跳跃游戏
  • 【计算机网络】深入解析TCP/IP参考模型:从四层架构到数据封装,全面对比OSI
  • 面经-项目
  • 革新测试管理 2.0丨Storm UTP统一测试管理平台智能化升级与全流程优化
  • HCIP之VRRP
  • 晶晨S905L3A(B)-安卓9.0-开启ADB和ROOT-支持IPTV6-支持外置游戏系统-支持多种无线芯片-支持救砖-完美通刷线刷固件包
  • memtest86检测内存