当前位置: 首页 > news >正文

深度学习入门1 基于Python的理论与实现

torch.unsqueeze()将一维数据变为二维数据,torch只能处理二维数据

第3章 神经网络

  • 实现softmax函数时的注意事项:为防止e的指数运算造成溢出

 

矩阵的第 0 维是列方向,第 1 维是行方向

第4章 神经网络的学习

损失函数:

均方误差

交叉熵误差

求所有训练数据的损失函数的总和,以交叉熵误差为例,可以写成

数值微分:利用微小的差分求导数的过程称为数值微分。所谓数值微分就是用数值方法近似求解函数的导数的过程。

梯度法:在梯度法中,函数的取值从当前位置沿着梯度方向前进一定距离,然后在新的地方重新求梯度,再沿着新梯度方向前进,  如此反复,不断地沿梯度方向前进。像这样,通过不断地沿梯度方向前进,  逐渐减小函数值的过程就是梯度法。

学习率决定在一次学习中,应该学习多少,以及在多大程度上更新参数

相关文章:

  • Photoshop 2025安装包下载及Photoshop 2025详细图文安装教程
  • 【LeetCode 题解】算法:8.字符串转换整数(atoi)
  • 自动化测试selenium(Java版)
  • CentOS 8 安装 Redis 全流程指南:从基础部署到远程安全配置
  • 音视频 三 看书的笔记 MediaPlayer的C/S架构
  • 数据库设计-笔记4
  • DeepSeek深度解析:AI在体育比分网中的应用场景与技术实践
  • Kali Linux 下安装 Sublime Text 详细教程
  • 各类神经网络学习:(五)LSTM 长短期记忆(上集),结构详解
  • 01 设计模式和设计原则
  • AI 在测试中的应用:从自动化到智能化的未来
  • Ubuntu下UEFI安全启动安装Nvdia驱动
  • JavaScript Fetch API
  • el-table + el-pagination 前端实现分页操作
  • secp256k1的模数P是如何选择的?
  • Java反射机制详解:原理、应用与最佳实践
  • Python内存管理探秘:让程序轻盈如羽的底层艺术
  • 畅享Mac桌面版TikTok!
  • 70. Linux驱动开发与裸机开发区别,字符设备驱动开发
  • 服务器中防火墙的重要性
  • 中国人保不再设监事会,国寿集团未再设置监事长职务
  • 在岸、离岸人民币对美元汇率双双升破7.26关口
  • 央行召开落实金融“五篇大文章”总体统计制度动员部署会议
  • 张元济和百日维新
  • 新华每日电讯:从上海街区经济看账面、市面、人面、基本面
  • 江西省国资委原副主任李键主动向组织交代问题,接受审查调查