当前位置: 首页 > news >正文

【深度学习与实战】3.1 逻辑回归模型

‌1. 定义与核心思想

逻辑回归(Logistic Regression)是一种用于‌二分类问题‌的统计学习方法,通过‌sigmoid函数‌将线性回归的输出映射到[0,1]区间,表示样本属于某一类别的概率‌。

  • 本质‌:广义线性模型,适用于因变量为二分类(如“是/否”、“成功/失败”)的场景‌。

  • 核心公式‌:

P(Y = 1 | X)=\frac{1}{1+e^{-z}},z=\beta_0 + \beta_1X_1 +\cdots +\beta_nX_n 

          其中z为线性组合,\beta为模型参数 

  • P(Y = 1 | X):在特征XX条件下,样本属于类别1的概率。
  • sigmoid函数‌(\frac{1}{1+e^{-z}}):将线性组合z压缩到(0,1)之间,提供非线性概率转换。
  • z:线性组合,由特征加权和加截距项组成。
  • \beta_0‌:截距项(偏置),调整决策边界的偏移。
  • \beta_1+ \beta_2 +\cdots +\beta_n‌:特征系数,反映每个特征对结果的影响方向和大小。
  • X_1,X_2...X_n‌:输入特征变量。

2. Sigmoid函数的作用

  • 功能‌:将线性输出 z 转换为概率值,公式为:

 \sigma (z)=\frac{1}{1+e^{-z}}

  • 特性‌:
    • 输出范围(0,1),适合表示概率‌;
    • 当 z=0 时,\sigma (z) = 0.5,即分类阈值‌

3. 模型参数估计

  • 最大似然估计(MLE)‌:通过最大化观测数据的联合概率求解参数‌。
    • 对数似然函数‌:

 \operatorname{l n} L(\beta) = \sum_{i=1}^{n}[y_i\operatorname{l n}p_i+(1-y_i)\operatorname{l n}(1-p_i)]

        其中 p_i = P(Y =1|X^{(I)}).‌

  • 损失函数(交叉熵)‌: 

 J(\beta) = -\frac{1}{N} \operatorname{l n}L(\beta)

        通过梯度下降法最小化损失‌

4. 决策边界与系数解释

  • 决策边界‌:线性超平面 z=0,即 \beta_0 + \beta_1X_1 +\cdots +\beta_nX_n=0
  • 系数意义‌:
    • e^{\beta_i}表示特征 X_i​ 每增加1单位,‌胜率(Odds)‌的倍数变化‌。
    • 例如,\beta_1=0.8 时,e^{0.8} \approx 2.23,即 X_1​ 增加1单位,胜率提高至2.23倍‌

‌5. 计算示例

问题‌:预测学生是否通过考试,特征为学习时间(小时)和出勤率(比例),模型已训练,参数为:

\beta_0 =-2,\beta_1=0.8,\beta_2=1.5

学生数据‌:学习时间X_1=3小时,出勤率X_2=0.9,计算通过考试的概率。 

步骤‌:

  1. 计算线性组合z

z=\beta_0 + \beta_1X_1 +\beta_2X_2=-2+0.8\times 3+1.5\times0.9=2+2.4+1.35=1.75

  1. 应用sigmoid函数‌:

                P(Y = 1 | X)=\frac{1}{1+e^{-1.75}}\approx \frac{1}{1+0.173}\approx \frac{1}{1.173 }\approx0.852

        预测结果‌:概率为85.2%,超过阈值0.5,预测为‌通过考试‌。

相关文章:

  • 网络相关基本概念
  • Rasa总体目录架构介绍
  • Python中如何用正则表达式精准匹配IP地址?
  • 常用环境部署(二十六)——Centos搭建MQTT服务端EMQX
  • 35.Java线程池(线程池概述、线程池的架构、线程池的种类与创建、线程池的底层原理、线程池的工作流程、线程池的拒绝策略、自定义线程池)
  • OpenStack Yoga版安装笔记(十九)启动一个实例(Self-service networks)
  • mysql 重复读自己事务中可以看到新插入数据
  • JS里对于Map的简单介绍
  • 蓝桥杯简单题练习
  • win11 redis3.0下载和运行
  • 力扣面试150题--有效的数独
  • 【Android】Android 打包 Release 崩溃问题全解析:Lint 错误、混淆类丢失及解决方法大全
  • React 条件渲染
  • Agent2Agent协议学习资源大全:从理论到实践
  • 【Linux】单例模式及其在线程池中的应用
  • Spring Boot 集成 POI
  • 【Deepseek基础篇】--v3基本架构
  • 【SLAM】将realsense-viewer录制的rosbag视频导出成图片序列(RealSense D435)
  • 二分算法的入门笔记
  • Linuix基础11
  • 有个可以做图片的网站/如何做好seo基础优化
  • 苏州网站建设kgu/其中包括
  • 建设工程消防监督管理规定网站/微商怎样让客源主动加你
  • 怎么查看网站外链效果/自己有网站怎么推广
  • 百度搜索搜不到网站/关键词调词平台费用
  • 做网站很简单/百度助手app下载