当前位置: 首页 > news >正文

线性回归计算

一、理论:明确线性回归的核心逻辑

  1. 模型本质:线性回归是通过属性的线性组合实现预测的模型,核心目标是找到最优的直线(单变量)、平面(双变量)或超平面(多变量),最小化预测值与真实值的误差。其一般形式分为两种,单变量为f(x)=wx + b,多变量则通过向量简化为f(x)=w^T x + b(其中w为权重向量,b为截距),直观体现了 “属性线性组合” 的核心思想。
  2. 核心概念区分:清晰理解了线性回归的基础定义与延伸概念,比如 “最小二乘法” 是基于均方误差(对应欧氏距离)最小化的求解方法,核心是让所有样本到拟合线的欧氏距离之和最小;而 “参数估计” 则是通过计算wb,使误差函数E(w,b)(残差平方和)最小的过程,二者共同构成了线性回归 “建模 - 求解” 的理论基础。

二、方法:掌握模型评估与参数求解

  1. 评估指标体系:学会用三类关键指标判断模型拟合效果,各指标功能明确且互补:
    • SSE/RSS(残差平方和):直接计算所有样本预测值与真实值差值的平方和,反映误差总量,值越小误差越小;
    • MSE(均方误差):对 SSE 取均值,消除样本数量影响,更适合不同数据集间的误差对比;
    • R²(决定系数):通过 “1 - SSE/SST” 计算(SST 为总平方和),取值范围在 0-1 之间,越接近 1 说明模型对数据的解释能力越强,是判断拟合效果最直观的指标。
  2. 参数求解步骤:理解了最小二乘法求解wb的数学逻辑:先对误差函数E(w,b)分别求wb的偏导,再令偏导数为 0,通过推导得出wb的最优解公式(如单变量中w与样本xy的均值相关,by均值减去wx均值的乘积),这一过程让我意识到线性回归的 “最优解” 并非主观选择,而是基于数学推导的客观结果。

三、实践:落地模型应用与工具使用

  1. 工具操作要点:初步掌握了 Python 中sklearn.linear_model.LinearRegression()的核心参数与用法:
    • fit_intercept:控制模型是否包含截距b,默认 True(即拟合y=wx+b),若设为 False 则模型强制过原点(y=wx),需根据数据特点选择;
    • normalize:控制是否对数据归一化,默认 False,当属性量纲差异大时可开启,避免量纲影响权重计算。
  2. 案例实践认知:通过 “波士顿房价预测” 的课堂练习案例,理解了线性回归的应用流程 —— 从数据准备、模型初始化与训练(fit方法),到用模型预测(predict方法),再用 MSE、R² 评估效果,形成了 “数据 - 模型 - 评估” 的完整实践闭环,也体会到线性回归在连续值预测(如房价、销量)场景中的实用性。
  3. 自己又在课后实现了线性回归计算糖尿病患者发病率,通过今天的学习成功完成了所有的功能,总而言之今天是收获满满的一天。

四、总结与反思

线性回归作为机器学习的 “入门模型”,其核心逻辑(线性组合、误差最小化)是理解更复杂模型(如逻辑回归、线性 SVM)的基础。但同时也意识到其局限性:仅适用于数据呈线性关系的场景,若数据存在非线性关联则拟合效果差,后续需进一步学习非线性模型(如多项式回归)以应对更多场景。此次学习不仅掌握了线性回归的知识,更培养了 “从理论推导到代码实践” 的思维,为后续机器学习学习奠定了扎实基础。

http://www.dtcms.com/a/344133.html

相关文章:

  • 华为云物联网产品架构解析:资源空间、群组、产品、标签、网关、设备与子设备的关系梳理与设置指南
  • AI重构智慧展馆
  • 【数据分享】中国371个城市的坡度矢量数据和excel数据
  • [react] class Component and function Component
  • Android音频学习(十四)——加载音频设备
  • Mysql InnoDB 底层架构设计、功能、原理、源码系列合集【四、事务引擎核心 - MVCC与锁机制】
  • prompt提示词2
  • 【思考】什么是服务器?什么是服务?什么是部署?
  • MongoDB 完整指南
  • 机器人爆发、汽车换代,速腾聚创开始讲新故事
  • 线性规划在数学建模中的应用
  • MyCAT高可用
  • Go语言实战案例-使用SQLite实现本地存储
  • Codeforces1043 A至F 题解
  • 【基础-判断】合理的动效可以帮助引导、取悦用户,减少等待时间,更能增加产品识别度,让用户舒适的的使用产品
  • 【序列晋升】12 Spring Boot 约定优于配置
  • 基于 Docker 的高可用 WordPress 集群部署:分布式 Nginx + Keepalived、MySQL 主从复制与 ProxySQL 读写分离
  • 行缓存(line buffer)在图像卷积中的工作方式
  • 【iOS】YYModel第三方库源码
  • 飞机起落架减震筒的深孔检测方法探究 - 激光频率梳 3D 轮廓检测
  • 用户登录Token缓存Redis实践:提升SpringBoot应用性能
  • Flutter学习笔记(七)---主题
  • 嵌入式学习day34-网络-tcp/udp
  • 如何判断是否应该为了一个小功能而引入一个大体积的库
  • 配电网重构优化:以减小网损为目标的智能算法实现
  • GitLab CI :深入剖析 gl-sbom-report.cdx.json 解码“数字身份证”
  • 云蝠智能 VoiceAgent:重构售后服务场景
  • 岭回归算法拉索回归
  • LeeCode 40.组合总和II
  • 数据结构之深入探索归并排序