当前位置：首页 > news >正文

【深度学习2】logistic回归以及梯度下降

news 2025/10/2 14:16:44

逻辑回归（Logistic Regression）是一种广泛应用于分类问题的统计学习方法，尤其适用于二分类任务（如 “是 / 否”“正 / 负”）。本质上是一种分类算法，通过建立输入特征与输出类别之间的概率关系来进行预测。

二分分类

二分分类输出是1 / 否0

目的是训练出一个分类器，特征向量x作为输入（如图片的像素点），输出预测结果标签y是1/0

常用符号：

(x,y）表示一个单独的样本
x是n维特征向量
y∈{1, 2}
m表示训练集样本个数

逻辑回归

$\widehat{y} = \sigma \left \{ w^{T}\cdot x+b \right \}$

$\sigma\left ( z \right ) = \frac{1}{1+e^{-z}}$

$\widehat{y} = P\left ( y=1|x \right )$

z越大y越靠近1，反之y靠近0.

损失函数（Loss function）

损失函数用于衡量单个训练样本的效果

损失函数用来衡量预测输出值 $\widehat{y}$ 和实际值y有多接近。

损失函数越小（误差越小）越好。

逻辑回归中常用的损失函数是交叉熵损失函数（Cross-Entropy Loss）:

$L\left ( \widehat{y},y \right ) = -(ylog \widehat{y}+(1-y)log(1-\widehat{y}))$

成本函数J（cost function）用于衡量参数w和b的效果

J(w, b)= 所有损失函数的平均值

梯度下降法（gradient descent）

成本函数J是一个关于参数w和b的凸函数，要找到它的最小值点（平均损失最小）

梯度下降(就是要求导)：从初始点开始（逻辑回归可以任意选一个初始点，因为成本函数是凸函数），朝最陡的下坡方向走一步（尽快的下降），通过几次梯度下降的迭代找到那个最小值点（全局最优解）

w、b的迭代：

$w = w-\alpha \frac{\partial J(w,b)}{\partial w}$

$b = b-\alpha \frac{\partial J(w,b)}{\partial b}$

其中α是学习率（learning rate），后面乘上斜率（导数）实现值减小

前向传播和反向传播

前向传播计算神经网络的输出
反向传播计算对应的梯度（导数）

下图蓝色部分是前向传播，红色部分是反向传播（用于计算J对其他变量的倒数）：

在编写代码时上述例子J对其他变量的求导写作dJvar/dvar

逻辑回归中的梯度下降

假设这个函数中有两个特征x1和x2，会得到下面一个传播过程

反向传播计算dL/da-->dL/dz-->dL/dw和dL/db，最后对w和b的值进行迭代。

多个样本的梯度下降

上面讲的都是二分类，只有两个特征样本。

m个样本的成本函数公式为：

$J(w,b) = \frac{1}{m}\Sigma_{i=1}^{m}L(a^{(i)},y)$

梯度下降：

参数初始化全为0，
前向传播计算出J，
循环计算每个特征对于J的倒数，
得到各自的w和b

查看全文

http://www.dtcms.com/a/323416.html

synchronized和RentrantLock用哪个?

Datawhale AI夏令营第三期，多模态RAG方向 Task2

小白成长之路-Docker部署

第二十八天(cookiesessiontokeny验证)

JVM性能调优的原则有哪些？

深入理解C++构造函数与初始化列表

P1025 [NOIP 2001 提高组] 数的划分题解

【嵌入式DIY实例-Arduino篇】-水质检测系统

SQL面试题及详细答案150道（01-20） --- 基础概念与语法篇

python踩坑之识别错误...

如何分析需求的可行性

Spring——Spring懒加载设计使用场景

深入解析进程创建与终止机制

Linux 信号处理标志sa_flags详解

MPU-6050 超实用入门

一文详解 C++ 继承体系

[C/C++线程安全]_[中级]_[多线程如何使用共享锁提升性能]

EP06：【DL 第二弹】动态计算图与梯度下降入门

【C/C++】具有C风格的强制类型转换：显式类型转换、隐式类型转换，C语言强制类型转换

第六章：【springboot】框架springboot原理、springboot父子工程与Swagger

算法题（183）：质量检测

《答客难》东方朔

网络原理-初识

FreeRTOS入门知识（初识RTOS任务调度）（三）

AVL树的四种旋转

【Python 语法糖小火锅 · 第 4 涮】

资深全栈工程师面试题总结

【牛客刷题】小红的区间删除

第16届蓝桥杯Scratch选拔赛初级及中级（STEMA）2024年11月24日真题

Linux之shell脚本篇（四）