当前位置: 首页 > news >正文

深度学习入门1 基于Python的理论与实现

torch.unsqueeze()将一维数据变为二维数据,torch只能处理二维数据

第3章 神经网络

  • 实现softmax函数时的注意事项:为防止e的指数运算造成溢出

 

矩阵的第 0 维是列方向,第 1 维是行方向

第4章 神经网络的学习

损失函数:

均方误差

交叉熵误差

求所有训练数据的损失函数的总和,以交叉熵误差为例,可以写成

数值微分:利用微小的差分求导数的过程称为数值微分。所谓数值微分就是用数值方法近似求解函数的导数的过程。

梯度法:在梯度法中,函数的取值从当前位置沿着梯度方向前进一定距离,然后在新的地方重新求梯度,再沿着新梯度方向前进,  如此反复,不断地沿梯度方向前进。像这样,通过不断地沿梯度方向前进,  逐渐减小函数值的过程就是梯度法。

学习率决定在一次学习中,应该学习多少,以及在多大程度上更新参数

http://www.dtcms.com/a/93249.html

相关文章:

  • Photoshop 2025安装包下载及Photoshop 2025详细图文安装教程
  • 【LeetCode 题解】算法:8.字符串转换整数(atoi)
  • 自动化测试selenium(Java版)
  • CentOS 8 安装 Redis 全流程指南:从基础部署到远程安全配置
  • 音视频 三 看书的笔记 MediaPlayer的C/S架构
  • 数据库设计-笔记4
  • DeepSeek深度解析:AI在体育比分网中的应用场景与技术实践
  • Kali Linux 下安装 Sublime Text 详细教程
  • 各类神经网络学习:(五)LSTM 长短期记忆(上集),结构详解
  • 01 设计模式和设计原则
  • AI 在测试中的应用:从自动化到智能化的未来
  • Ubuntu下UEFI安全启动安装Nvdia驱动
  • JavaScript Fetch API
  • el-table + el-pagination 前端实现分页操作
  • secp256k1的模数P是如何选择的?
  • Java反射机制详解:原理、应用与最佳实践
  • Python内存管理探秘:让程序轻盈如羽的底层艺术
  • 畅享Mac桌面版TikTok!
  • 70. Linux驱动开发与裸机开发区别,字符设备驱动开发
  • 服务器中防火墙的重要性
  • 上门家政小程序实战,从0到1解决方案
  • 学习本地部署DeepSeek的过程(基于LM Studio)
  • 调用通义千问实现语音合成并将合成的音频通过扬声器播放
  • Transformer 通关秘籍2:利用 BERT 将文本 token 化
  • 【悲观锁和乐观锁有什么区别】以及在Spring Boot、MybatisPlus、PostgreSql中使用
  • 简历含金量的描述和注意事项!
  • 如何用Redis统计网站的UV
  • 影刀魔法指令3.0:开启自动化新篇章
  • 计算机视觉3——模板匹配与拟合
  • Maven入门