当前位置: 首页 > news >正文

PyTorch之线性回归

1.定义:
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。线性回归是利用称为线性回归方程的最小二乘函数,对一个或多个自变量和因变量之间关系,进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。
在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。大于一个自变量情况的叫做多元回归。在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。

2.torchvision.datasets
对于常用数据集,可以使用torchvision.datasets直接进行读取。
torchvision.dataset是torch.utils.data.Dataset的实现。该包提供了以下数据集的读取:

MNIST
COCO (Captioning and Detection)
LSUN Classification
ImageFolder
Imagenet-12
CIFAR10 and CIFAR100
STL10

3.DataLoader
Pytorch 中提供了一种整理数据结构的变量,叫做DataLoader,我们能用它来包装自己的数据,进行训练。
函数定义:
torch.utils.data.DataLoader (dataset, batch_size=1, shuffle=False, sampler=None, num_workers=0, collate_fn=<function default_collate>, pin_memory=False, drop_last=False)

4.线性回归模型
建立线性回归模型需要继承Modules类,并实现__init__()方法,以及forward()方法:

init()方法,用于定义一些新的属性,这些属性可以包括Modules的实例。在本例中,即为一个torch.nn.Linear,即创建线性模型,在创建的同时,线性模型的参数也被初始化;
forward()方法,用于定义该Module进行forward时的运算,forward()方法接受一个输入,然后通过其他modules或者其他Function运算,来进行forward,返回一个输出结果。

损失函数
我们画出的拟合直线只是一个近似,因为肯定很多的点都没有落在直线上,那么我们的直线拟合程度到底怎么样呢?之前介绍的损失函数(loss function)同学们还记得吗?它就是用来估量模型的预测值 f(x)与真实值Y的不一致程度,损失函数越小,模型的鲁棒性就越好,直线拟合程度就越好。
最小二乘法是线性回归的一种,最小二乘法的基本原则是:最优拟合直线应该是使各点到回归直线的距离和最小的直线,即平方和最小。换言之,它是基于距离的,而这个距离就是我们用的最多的欧几里得距离。为什么它会选择使用欧式距离作为误差度量呢(即 Mean squared error,MSE),主要有以下几个原因:

简单,计算方便;
欧氏距离是一种很好的相似性度量标准;
在不同的表示域变换后特征性质不变。

平方损失(Square loss)的标准形式如下:
L(Y,f(x))=(Y−f(x))2
而在实际应用中,通常会使用均方差(MSE)作为一项衡量指标,公式如下:
MSE=nsum1leilen(Y−f(x))2​
Y−f(x)表示的是残差,整个式子表示的是残差的平方和的均值,而我们的目的就是最小化这个目标函数值,以求得最优的解。

5.优化方法:随机梯度下降法

import torch.optim
#定义优化函数
optimizer = optim.SGD(model.parameters(), lr=1e-4)

相关文章:

  • 第1课 配置FFmpeg+OpenCV开发环境
  • Kioptrix-3
  • 08 2024考研408-数据结构 第八章-排序学习笔记
  • 【51单片机系列】C51中的中断系统扩展实验
  • Linux ContOS7 日志管理(rsyslog)
  • Ubuntu 常用命令之 chown 命令用法介绍
  • STM32的以太网外设+PHY(LAN8720)使用详解(7):以太网数据接收及发送测试
  • ChatGPT4与ArcGIS Pro3助力AI 地理空间分析和可视化及助力科研论文写作
  • 【小黑嵌入式系统第十一课】μC/OS-III程序设计基础(一)——任务设计、任务管理(创建基本状态内部任务)、任务调度、系统函数
  • MFC窗体背景颜色的设置、控件白色背景问题、控件文本显示重叠问题、被父窗体背景覆盖的问题
  • myspl左外连
  • Amazon Toolkit — CodeWhisperer 使用
  • 【Linux】进程周边007之进程控制
  • 麒麟V10 ARM 离线生成RabbitMQ docker镜像并上传Harbor私有仓库
  • Oracle的学习心得和知识总结(三十一)| ODBC开放式数据库连接概述及应用程序开发
  • 异方差与多重共线性对回归问题的影响
  • 力扣:205. 同构字符串(Python3)
  • 设计模式之-装饰模式,快速掌握装饰模式,通俗易懂的讲解装饰模式以及它的使用场景
  • webpack 常见面试题
  • 使用 Taro 开发鸿蒙原生应用 —— 探秘适配鸿蒙 ArkTS 的工作原理
  • 中国证监会印发2025年度立法工作计划
  • 陕西永寿4岁女童被蜜蜂蜇伤致死,当地镇政府介入处理
  • 铲屎官花5万带猫狗旅行,宠旅生意有多赚?
  • 外卖员投资失败负疚离家流浪,经民警劝回后泣不成声给父母下跪
  • 习近平出席俄罗斯总统举行的欢迎仪式
  • 全球第七个迪士尼主题公园将落户阿布扎比