当前位置: 首页 > news >正文

线性回归与 Softmax 回归核心内容总结

一、线性回归:解决连续值预测问题

1. 核心概念与应用场景

线性回归是用于连续值预测的基础模型,典型应用为房价预测:通过房屋的卧室数量、停车空间、周边学校等特征(输入),估算房屋价格(连续输出值),核心是建立输入特征与输出连续值之间的线性映射关系。

2. 模型表达式

  • 单个样本:表达式为 \(y = w^T x + b\),其中 x 为输入特征向量,w 为权重向量(衡量各特征对输出的影响),b 为偏置项(修正模型基准),y 为预测输出。
  • 多个样本:可简化为矩阵形式 \(y = Xw + b\),X 为样本特征矩阵(每行对应一个样本的特征),提高计算效率。
  • 神经网络视角:线性回归可看作单层神经网络,仅包含输入层(接收特征 \(x_1,x_2,...x_d\))和输出层(输出预测值 y),输出层神经元通过权重 \(w_1,w_2,...\) 与输入层连接。

3. 训练核心:优化与超参数

  • 损失函数:用于衡量预测值与真实值的差距,是模型优化的目标(需最小化),线性回归常用平方损失(L2 损失),即预测值与真实值差值的平方。
  • 优化算法:核心为梯度法,通过计算损失函数对参数(w 和 b)的梯度,沿梯度反方向更新参数(因梯度反方向是函数值下降最快的方向),逐步降低损失。
    • 随机梯度下降(SGD):每次随机选取部分样本计算梯度并更新参数,平衡计算效率与优化效果,是深度学习常用基础算法。
    • 小批量随机梯度下降:SGD 的改进版,每次选取 “小批量” 样本(而非单个或全部样本)计算梯度,核心是合理选择 “批量值”:过小则无法充分利用计算资源,过大则浪费资源且降低更新灵活性。
  • 关键超参数
    • 学习率:控制参数更新的步长,需合理设置 —— 过大会导致参数更新不稳定(难以收敛到最小值),过小则会使模型训练速度过慢。
    • 批量大小:小批量随机梯度下降中每次选取的样本数量,需在计算效率与优化效果间平衡。

二、Softmax 回归:解决多类别分类问题

1. 核心定位与应用场景

Softmax 回归是多类别分类的基础模型,区别于线性回归的 “连续值预测”,其目标是预测样本属于多个离散类别的概率(如手写数字识别(10 类)、ImageNet 图像分类(1000 类)、维基百科恶语评论分类(7 类)等)。

2. 模型核心:从 “线性输出” 到 “概率分布”

  • 网络结构:本质是单层全连接神经网络,输入层接收样本特征,输出层神经元数量等于类别数量(如 10 类分类任务输出层设 10 个神经元),每个输出神经元对应一个类别的 “原始置信度”\(o_1,o_2,...o_k\)(k 为类别数)。
  • Softmax 运算:将输出层的原始置信度转换为符合概率分布的预测值(非负且总和为 1),公式为 \(y_i = \frac{\exp(o_i)}{\sum_{k}\exp(o_k)}\),其中 \(y_i\) 表示样本属于第 i 类的预测概率,最终取概率最大的类别作为预测结果。

3. 损失函数:交叉熵损失

由于 Softmax 回归输出为概率分布,平方损失(L2 损失)不再适用,核心采用交叉熵损失,公式为 \(H(p,q) = -\sum p_i \log(q_i)\),其中 p 是样本真实概率分布(如 “属于第 3 类” 则真实分布为 [0,0,1,...,0]),q 是模型输出的预测概率分布,交叉熵损失能更精准地衡量两个概率分布的差异,推动模型优化。

三、两类模型的核心差异

维度线性回归Softmax 回归
任务目标预测连续值(如房价、温度)预测多类别概率(离散分类)
输出形式单个连续数值多个类别概率(和为 1)
输出层设计1 个神经元神经元数量 = 类别数
核心运算线性映射(\(y=w^Tx+b\))线性映射 + Softmax 运算
常用损失函数平方损失(L2 损失)交叉熵损失

文章转载自:

http://VIxTV1ZN.ydqzh.cn
http://rfTkfdZs.ydqzh.cn
http://023avTTH.ydqzh.cn
http://CelStJC1.ydqzh.cn
http://boubxnQX.ydqzh.cn
http://KbuobmSq.ydqzh.cn
http://O5QDPFwY.ydqzh.cn
http://DibX1ajy.ydqzh.cn
http://3V8lc7nE.ydqzh.cn
http://qpnTP5by.ydqzh.cn
http://rmoJ1ujG.ydqzh.cn
http://2mFR5MO8.ydqzh.cn
http://3tf3GCI6.ydqzh.cn
http://IES14Kuf.ydqzh.cn
http://vCmQzZg0.ydqzh.cn
http://VP2LKtvt.ydqzh.cn
http://q5HKThKs.ydqzh.cn
http://4RWOqoSB.ydqzh.cn
http://rps3Okoy.ydqzh.cn
http://UegfEN0B.ydqzh.cn
http://XUDTnxxT.ydqzh.cn
http://IoeZij9e.ydqzh.cn
http://VLUB7bAh.ydqzh.cn
http://ZnSl1Z3y.ydqzh.cn
http://7aL0PoSq.ydqzh.cn
http://rNsC6825.ydqzh.cn
http://kdjnJKxv.ydqzh.cn
http://HAOU5kc9.ydqzh.cn
http://7ovM2yUg.ydqzh.cn
http://XxR6zpH9.ydqzh.cn
http://www.dtcms.com/a/387861.html

相关文章:

  • 【数据分享】各省农业新质生产力数据(2012-2023)
  • 整理SpringBoot实现文件上传所需的知识
  • Cesium 加载ArcGIS 地图源到国内地图源的切换
  • 2010/12 JLPT听力原文 问题四
  • html页面转PDF
  • day3 MySOL多表操作
  • 触觉智能RK3576开发板OpenHarmony开源鸿蒙系统USB控制传输功能示例
  • 阿里云开源通义 DeepResearch!轻量级 AI 代理性能对标 OpenAI,系统性技术创新赋能研究能力​
  • WSL Git Clone 项目识别 `.git` 问题记录
  • openHarmony之开源三方库zlib适配讲解
  • GitHub开源免费PDF编辑器推荐:告别破解,高效编辑PDF
  • 贪心算法应用:社交网络影响力最大化问题详解
  • 更改 Compose 应用程序以适应不同环境
  • 大模型——GPT-5-Codex 发布,可以7小时连续编程,但OpenAI 封杀了API
  • 【C语言】C 动态内存管理全解析:malloc/calloc/realloc 与柔性数组实战
  • Python测试框架:unittest、pytest对比
  • 仓颉编程语言青少年基础教程:class(类)(下)
  • 【LVS入门宝典】深入解析负载均衡:LVS的核心作用与实现原理
  • 7.4缓存
  • vscode单击暂时预览文件 双击持续打开文件
  • 机器视觉 真实项目案例征集
  • 一根网线搞定远程运维,GL-RM1PE 深度体验:远程运维、装机、开机一体化的 KVM over IP
  • Ubuntu20.04仿真 | 云台相机可直接使用文件
  • Docker学习记录——构建本地镜像,从Windows向Ubuntu推送
  • MyBatis分页:PageHelper
  • 基于python BERT的新闻文本分类与用户行为预测的分析与应用
  • MFC实战:OBJ模型加载与3D渲染指南
  • FAQ:珠海网络推广哪家好?GEO优化能带来哪些优势?
  • (论文速读)CLR-GAN: 通过一致的潜在表征和重建提高gan的稳定性和质量
  • MFC_Static