当前位置: 首页 > wzjs >正文

中小企业网站的建设实践报告诊所网站建设

中小企业网站的建设实践报告,诊所网站建设,关键词挖掘啊爱站网,做图的网站《动手学深度学习》-4.2-笔记 多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层,并通过激活函数转换隐藏层的输出。 常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。 import torch from torch import nn from d2l import torch as d2lbatch_size …

《动手学深度学习》-4.2-笔记

  • 多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层,并通过激活函数转换隐藏层的输出。

  • 常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。

  • import torch
    from torch import nn
    from d2l import torch as d2lbatch_size = 256
    train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

    分析 :导入fashion_ minist数据集(图像数据集处理可以参考3.5

  • num_inputs, num_outputs, num_hiddens = 784, 10, 256W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens, requires_grad=True) * 0.01)
    b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
    W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
    b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))params = [W1, b1, W2, b2]

    定义输入、输出和隐藏层的维度:784个输入特征 和10个类的简单分类数据集,隐藏层的维度为256,
    定义网络参数:W1b1 是第一层(输入层到隐藏层)的权重和偏置:

  • torch.randn(num_inputs, num_hiddens):生成一个形状为 (784, 256) 的张量,其元素从标准正态分布(均值为 0,标准差为 1)中随机采样。

    W2b2 是第二层(隐藏层到输出层)的权重和偏置:

  • torch.randn(num_hiddens, num_outputs):生成一个形状为 (256, 10) 的张量,其元素从标准正态分布中随机采样。

    def relu(X):a = torch.zeros_like(X)return torch.max(X, a)
    

    将实现ReLU激活函数, 

模型

def net(X):X = X.reshape((-1, num_inputs))H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法return (H@W2 + b2)
  1. 输入数据 X 被重塑为 (batch_size, num_inputs) 的形状。

  2. 第一层(输入层到隐藏层)的计算:H = relu(X@W1 + b1),其中 relu 是激活函数。

  3. 第二层(隐藏层到输出层)的计算:output = H@W2 + b2,返回输出层的结果。

损失函数 

loss = nn.CrossEntropyLoss(reduction='none')

 使用了 PyTorch 的 nn.CrossEntropyLoss 来定义一个损失函数,并且通过 reduction='none' 参数指定了损失的计算方式。

  • reduction='none' 表示损失函数会为每个样本单独计算损失值,返回一个形状为 (batch_size,) 的张量,其中每个元素对应一个样本的损失值。

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

定义了训练的轮数、学习率,并使用随机梯度下降(SGD)优化器来更新网络参数,最后调用一个训练函数来执行训练和评估过程。
d2l.train_ch3 是一个封装好的函数,内部逻辑

  1. 初始化

    • 初始化训练和测试的损失、准确率等指标。

  2. 训练循环

    • 遍历每个训练轮数(num_epochs)。

    • 在每个训练轮中:

      • 遍历训练数据迭代器(train_iter),逐批次获取训练数据。

      • 对每个批次的数据:

        • 前向传播:通过网络模型(net)计算输出。

        • 计算损失:使用损失函数(loss)计算模型输出与真实标签之间的损失。

        • 反向传播:计算梯度。

        • 参数更新:使用优化器(updater)更新网络参数。

      • 记录训练损失和准确率。

  3. 测试

    • 在每个训练轮结束后,使用测试数据迭代器(test_iter)评估模型的性能。

    • 计算测试损失和准确率。

  4. 输出

    • 打印每个训练轮的训练损失、训练准确率、测试损失和测试准确率。报错,修改:要解决这个问题,需要确保在调用 backward() 之前,损失值是一个标量。将损失函数的 reduction 参数改为 'mean''sum',这样损失函数会返回一个标量值,而不是一个张量。

 d2l.predict_ch3 是一个函数,通常来自 Dive into Deep Learning (D2L) 教程库,用于对测试数据进行预测并展示预测结果。它的主要作用是使用训练好的神经网络模型对测试数据进行分类预测,并将预测结果与真实标签进行对比,以便直观地评估模型的性能。

http://www.dtcms.com/wzjs/558498.html

相关文章:

  • 国家标准物质网站建设企业网站建设能解决什么问题
  • 如何给网站添加icon自己做动画网站
  • 北辰手机网站建设wordpress2019
  • 网站导航栏怎么做简单家居用品东莞网站建设
  • 地图网站怎么做的数据分析软件哪个最好用
  • 营销型网站有哪些功能wordpress 中文名注册
  • 企业网站展示论文常州高端网站定制公司
  • 深圳建网站需要多少钱wordpress购买
  • 桂林北站附近住宿视频素材库网站下载
  • 做网站的介绍无锡网站排名优化费用
  • 大英哪里有做网站的在百度上怎么建立网站吗
  • 西城企业网站建设徐汇微信手机网站制作
  • 网站在百度搜索不到婚纱摄影网
  • 订阅号栏目里做微网站wordpress背景
  • 食品饮料网站源码东莞seo优化排名
  • h5响应式网站技术唐山做网站优化
  • 建设大学网站服务兼职做网站编辑
  • 小说网站的里面的搜索是怎么做的网站页面设计怎么收费
  • 如何做网站公司怎么做网络销售的网站
  • 烟台免费网站建设app展示网站模板
  • wap网页开发wordpress优化提速
  • jsp网站设计网站批量修改
  • 朝阳网站设计深圳最新新闻事件
  • 怎么学好网站建设给人做网站多少钱
  • 软件免费下载网站有哪些设计公司网站设计报价明细表
  • 上传网站视频要怎么做才清楚wordpress分类信息插件
  • 免费查公司的网站hao123浏览器官方下载
  • 杭州网站建设seo优化wordpress 文章评分插件
  • 医院网站建设建议虚拟主机wordpress安装教程
  • 如何做自己的业务网站办公空间设计案例平面图