当前位置: 首页 > wzjs >正文

微信营销方式深圳网站优化哪家好

微信营销方式,深圳网站优化哪家好,企业网站建设知识应用技能,从色彩度讨论如何建设一个网站.《动手学深度学习》-4.2-笔记 多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层,并通过激活函数转换隐藏层的输出。 常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。 import torch from torch import nn from d2l import torch as d2lbatch_size …

《动手学深度学习》-4.2-笔记

  • 多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层,并通过激活函数转换隐藏层的输出。

  • 常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。

  • import torch
    from torch import nn
    from d2l import torch as d2lbatch_size = 256
    train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

    分析 :导入fashion_ minist数据集(图像数据集处理可以参考3.5

  • num_inputs, num_outputs, num_hiddens = 784, 10, 256W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens, requires_grad=True) * 0.01)
    b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
    W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
    b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))params = [W1, b1, W2, b2]

    定义输入、输出和隐藏层的维度:784个输入特征 和10个类的简单分类数据集,隐藏层的维度为256,
    定义网络参数:W1b1 是第一层(输入层到隐藏层)的权重和偏置:

  • torch.randn(num_inputs, num_hiddens):生成一个形状为 (784, 256) 的张量,其元素从标准正态分布(均值为 0,标准差为 1)中随机采样。

    W2b2 是第二层(隐藏层到输出层)的权重和偏置:

  • torch.randn(num_hiddens, num_outputs):生成一个形状为 (256, 10) 的张量,其元素从标准正态分布中随机采样。

    def relu(X):a = torch.zeros_like(X)return torch.max(X, a)
    

    将实现ReLU激活函数, 

模型

def net(X):X = X.reshape((-1, num_inputs))H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法return (H@W2 + b2)
  1. 输入数据 X 被重塑为 (batch_size, num_inputs) 的形状。

  2. 第一层(输入层到隐藏层)的计算:H = relu(X@W1 + b1),其中 relu 是激活函数。

  3. 第二层(隐藏层到输出层)的计算:output = H@W2 + b2,返回输出层的结果。

损失函数 

loss = nn.CrossEntropyLoss(reduction='none')

 使用了 PyTorch 的 nn.CrossEntropyLoss 来定义一个损失函数,并且通过 reduction='none' 参数指定了损失的计算方式。

  • reduction='none' 表示损失函数会为每个样本单独计算损失值,返回一个形状为 (batch_size,) 的张量,其中每个元素对应一个样本的损失值。

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

定义了训练的轮数、学习率,并使用随机梯度下降(SGD)优化器来更新网络参数,最后调用一个训练函数来执行训练和评估过程。
d2l.train_ch3 是一个封装好的函数,内部逻辑

  1. 初始化

    • 初始化训练和测试的损失、准确率等指标。

  2. 训练循环

    • 遍历每个训练轮数(num_epochs)。

    • 在每个训练轮中:

      • 遍历训练数据迭代器(train_iter),逐批次获取训练数据。

      • 对每个批次的数据:

        • 前向传播:通过网络模型(net)计算输出。

        • 计算损失:使用损失函数(loss)计算模型输出与真实标签之间的损失。

        • 反向传播:计算梯度。

        • 参数更新:使用优化器(updater)更新网络参数。

      • 记录训练损失和准确率。

  3. 测试

    • 在每个训练轮结束后,使用测试数据迭代器(test_iter)评估模型的性能。

    • 计算测试损失和准确率。

  4. 输出

    • 打印每个训练轮的训练损失、训练准确率、测试损失和测试准确率。报错,修改:要解决这个问题,需要确保在调用 backward() 之前,损失值是一个标量。将损失函数的 reduction 参数改为 'mean''sum',这样损失函数会返回一个标量值,而不是一个张量。

 d2l.predict_ch3 是一个函数,通常来自 Dive into Deep Learning (D2L) 教程库,用于对测试数据进行预测并展示预测结果。它的主要作用是使用训练好的神经网络模型对测试数据进行分类预测,并将预测结果与真实标签进行对比,以便直观地评估模型的性能。

http://www.dtcms.com/wzjs/384936.html

相关文章:

  • java网站开发前景深圳网站推广
  • 响应式中文网站模板游戏代理平台
  • 销售型网站如何做推广seo com
  • 注册top域名做公司网站网站发布与推广方式
  • 科技公司内蒙古网站制作seo分析工具
  • 模板网站开发今日最新抗疫数据
  • 电子书网站 自己做seo网络优化专员是什么意思
  • 做外贸有那些网站平台免费推广网站2023mmm
  • 诛仙3官方网站做花灯答案网络营销具有什么特点
  • 织梦软件展示网站app推广接单发布平台
  • 做动态网站该看的书国内免费建站平台
  • 怎样建设那种游戏网站产品故事软文案例
  • 学校网站建设总结福州seo顾问
  • 公司建设网站申请信用卡吗收录好的网站有哪些
  • 大学生网站开发大赛无锡网络公司
  • 广州海珠区网站建设可以访问违规网站的浏览器
  • 极速建站系统开发能打开任何网站浏览器
  • 乌鲁木齐网站建设青岛网站seo服务
  • 网站查看空间商网站搭建关键词排名
  • 台州品牌网站建设郑州网络营销公司排名
  • 怎样查看网站备案号网络销售是干嘛的
  • 做游戏角色视频的网站留电话的广告网站
  • 网页设计指什么最新黑帽seo教程
  • 怎样做网站呢 优帮云郑州优化公司有哪些
  • dede做的网站怎样去换模版win7系统优化软件
  • 山东省住房和城乡建设厅官方网站淘宝seo排名优化
  • 杭州网站建设宣盟网络新闻10 30字
  • 赤峰做企业网站公司北京seo优化费用
  • 渭南做网站价格搜索引擎优化公司排行
  • 濮阳网络电视台上海关键词优化外包