当前位置: 首页 > news >正文

从0开始学习计算机视觉--Day04--损失函数

在上次学习中,我们知道了线性分类的函数是f(x,W),但并没有解释要怎么得到W权重矩阵的值,以及我们要怎么用训练数据来确定它的最优权重矩阵。在之前我们知道,假设用了10种类别的图片用于训练,将其中一种图片输入模型后,会根据W输出每个类别所对应的分数,但是并不是所属的类别分数就一定高,这时我们把这个W作为输入放入一个函数中,由这个函数根据是否图片对应的类别分数最高,来判断W的好坏,也就是能知道这个W距离真正好的W差了多少,我们把这个函数称之为损失函数(cost function),而不断地输入不同的W来找到损失最小的W的过程,就叫做优化过程。

一般会采用一个通用定义L=\frac{1}{N}\sum_{}^{}{L_{i}(f(x_{i},W),y_{i})},x和y就是训练集里的像素点数据和图片的标签,f是损失函数,L是输入N个样本后的平均损失值。在这个图片分类的例子中,采用的是多分类SVM的损失函数,如下图所示:

与二分类的分类函数有点类似,后者是只要计算A的损失值比B类大得多,就认为损失值为0(即为A类),前者只是把所有错误的类别放在了一起(可以理解为B类是一个错误类别的集合),计算过程与其类似。而图中的s_y_i代表的是正确的类别的分数,s_j则代表的是剩余错误的类比的分数和,图像里的意思就是当正确类别的分数,大于错误类比的分数和再加上1,即认为大于这个数值就认为这个图片被正确分类了,1是认为设定的安全边界,可以根据实际情况调整。将图中类别的分数分别带入公式计算得到猫的损失值为2.9,汽车的损失值为0,青蛙损失值为12.9,求得平均值为5.3。

值得注意的是,在训练的过程中,可以先不着急训练完整个模型,而是先输出损失值来判断,假如有C个类别,而输出的结果不是接近于C-1(假设设置边界为1),我们就需要检查一下是否有问题,因为C-1就代表正确类别的分数与错误类别的分数很接近,每个错误类别的损失值都接近于1。

学习来自于斯坦福教程:Stanford University CS231n: Deep Learning for Computer Vision

相关文章:

  • 【Linux指南】压缩、网络传输与系统工具
  • LinuxBridge的作用与发展历程:从基础桥接到云原生网络基石
  • 嵌入式项目:基于QT与Hi3861的物联网智能大棚集成控制系统
  • pandas---使用教程
  • docker小白自存-windows系统通过docker安装n8n-nodes-puppeteer
  • 基于GPS-RTK的履带吊车跑偏检测技术方案
  • Python网络自动化API接口统一库之napalm使用详解
  • Python打卡:Day38
  • 利用云雾自动化在智能无人水面航行器中实现自主碰撞检测和分类
  • redis配置文件-redis.conf
  • 【Docker】解决:构建(docker build)或重新运行容器时,丢失apt-get update问题
  • 【Docker基础】Docker容器管理:docker ps及其参数详解
  • HexHub开发运维利器Database, Docker, SSH, SFTP
  • 数据库外连接详解:方式、差异与关键注意事项
  • 基于fpga的串口控制的音乐播放器
  • Franka 机器人在配置空间距离场实验中的突破性应用:从算法优化到动态场景适配
  • Stable Diffusion 3终极提示词库:2000个工业设计场景生成公式(2025企业级实战指南)
  • html css js网页制作成品——HTML+CSS湘菜网页设计(4页)附源码
  • Ehcache、Caffeine、Spring Cache、Redis、J2Cache、Memcached 和 Guava Cache 的主要区别
  • 自动化保护 AWS ECS Fargate 服务:使用 Prisma Cloud 实现容器安全