当前位置: 首页 > wzjs >正文

wordpress网站设置关键词分类达人的作用

wordpress网站设置关键词,分类达人的作用,乐清做网站建设,影视网站文章目录 前言一、分类任务常用损失函数1. 交叉熵损失(Cross-Entropy Loss)数学形式使用场景特点训练状态分析损失下降损失震荡训练损失低但是验证损失高 2. Hinge Loss(合页损失)数学形式适用场景特点训练状态分析损失趋近于0损失…

文章目录

  • 前言
  • 一、分类任务常用损失函数
    • 1. 交叉熵损失(Cross-Entropy Loss)
      • 数学形式
      • 使用场景
      • 特点
      • 训练状态分析
        • 损失下降
        • 损失震荡
        • 训练损失低但是验证损失高
    • 2. Hinge Loss(合页损失)
      • 数学形式
      • 适用场景
      • 特点
      • 训练状态分析
        • 损失趋近于0
        • 损失不下降
    • 3. Focal Loss
      • 数学形式
      • 适用场景
      • 特点
      • 训练状态分析
        • 损失快速下降
        • 损失稳定后仍有波动
  • 二、回归任务常用损失函数
    • 1. 均方误差(Mean Squared Error, MSE)
      • 数学形式
      • 适用场景
      • 特点
      • 训练状态分析
        • 损失持续下降
        • 损失突然增大
    • 2. 平均绝对误差(Mean Absolute Error, MAE)
      • 数学形式
      • 适用场景
      • 特点
      • 训练状态分析
        • 损失缓慢下降
        • 损失波动小但值比较高
    • 3. Huber Loss
      • 数学形式
      • 适用场景
      • 特点
      • 训练状态分析
        • 损失平稳下降
        • 需调整δ
  • 三、损失函数值与训练状态的关系
  • 四、总结
    • 分类任务
    • 回归任务
    • 监控策略


前言

本文简单介绍了深度学习中常用的损失函数。比如用于回归任务的交叉熵损失、Focal Loss损失;用于分类任务的MAE\MSE\Huber损失等。


一、分类任务常用损失函数

1. 交叉熵损失(Cross-Entropy Loss)

数学形式

数学形式

𝑦𝑖,𝑐 样本 𝑖的真实标签(one-hot 编码)。
𝑝𝑖,𝑐:模型预测样本 𝑖 属于类别 𝑐的概率。

使用场景

适用场景:多分类任务(如手写数字识别、图像分类)。

特点

  1. 直接衡量预测概率分布与真实分布的差异。
  2. 错误预测的惩罚呈指数增长(梯度随误差增大而增大)。

训练状态分析

损失下降

损失下降:模型正在学习正确分类样本

损失震荡

损失震荡:学习率可能过高,或数据噪声较大

训练损失低但是验证损失高

训练损失低但验证损失高:过拟合(模型记忆训练数据,泛化能力差)。

2. Hinge Loss(合页损失)

数学形式

𝑦𝑖∈{−1,1}:真实标签。
𝑦^𝑖:模型输出的未归一化得分(如 SVM 的决策函数)。

适用场景

适用场景:二分类任务(如支持向量机)。

特点

  1. 正确分类且置信度高的样本损失为 0
  2. 误分类样本的惩罚与置信度线性相关

训练状态分析

损失趋近于0

损失趋近于 0:模型对大部分样本分类正确且置信度高

损失不下降

损失不下降:模型无法找到有效的分类边界(需调整超参数或特征)。

3. Focal Loss

数学形式

Focal Loss

  1. 𝛼:平衡类别权重的系数。
  2. 𝛾:聚焦参数降低易分类样本的权重。

适用场景

适用场景:类别不平衡问题(如目标检测中的前景-背景分类)。

特点

通过降低简单样本的权重,使模型更关注难样本。

训练状态分析

损失快速下降

损失快速下降:模型正在学习难样本的特征。

损失稳定后仍有波动

损失稳定后仍有波动:需调整 𝛾或数据增强策略。

二、回归任务常用损失函数

1. 均方误差(Mean Squared Error, MSE)

数学形式

均方误差

适用场景

适用场景:连续值预测(如房价预测、温度预测)。

特点

  1. 异常值敏感(平方放大大误差)。
  2. 输出为凸函数,利于梯度下降优化。

训练状态分析

损失持续下降

损失持续下降:模型正在拟合数据分布

损失突然增大

损失突然增大:可能遇到异常值或梯度爆炸。

2. 平均绝对误差(Mean Absolute Error, MAE)

数学形式

平均绝对误差

适用场景

适用场景:对异常值敏感的回归任务(如金融风险预测)。

特点

  1. 异常值鲁棒(线性惩罚)。
  2. 梯度恒定,可能导致收敛速度慢。

训练状态分析

损失缓慢下降

损失缓慢下降:需结合自适应优化器(如 Adam)。

损失波动小但值比较高

损失波动小但值较高:模型可能欠拟合(需增加网络容量)。

3. Huber Loss

数学形式

Huber Loss

适用场景

适用场景:存在少量异常值的回归任务(如传感器数据预测)。

特点

  1. 结合 MSE 和 MAE 的优点,对异常值鲁棒。
  2. 需手动设定阈值 𝛿。

训练状态分析

损失平稳下降

损失平稳下降:模型在平衡大误差和小误差的优化。

需调整δ

需调整 𝛿:根据误差分布动态选择。

三、损失函数值与训练状态的关系

损失函数行为 可能原因 解决方案
训练损失持续下降 模型正常学习中 持续监控验证集损失
验证损失上升 过拟合 增加正则化(Dropout, L2)、数据增强
损失震荡剧烈 学习率过高或批量过小 降低学习率、增大批量大小
损失长期不下降 模型容量不足、梯度消失/爆炸 加深网络、使用残差连接、调整初始化
训练/验证损失均高 欠拟合 增加模型复杂度、减少正则化、延长训练

四、总结

分类任务

分类任务:优先选择交叉熵损失,处理不平衡数据时使用 Focal Loss

回归任务

回归任务:根据**异常值情况选择 MSE(平滑优化)**或 MAE/Huber(鲁棒性)

监控策略

同时观察训练集和验证集损失,判断过拟合/欠拟合
使用学习率调度器(如 ReduceLROnPlateau)动态调整优化速度。


http://www.dtcms.com/wzjs/176445.html

相关文章:

  • 男做变态手术视频网站外贸营销策略都有哪些
  • web网站开发标题字体加粗成品网站货源1
  • 酒店和网站对接如何做看广告赚钱
  • 做题网站中计算多项式的值怎么做外贸谷歌推广
  • 网上怎样找装修设计师志鸿优化设计答案
  • 网站制作软件区别电商运营推广
  • 社区服务流程的文献广东网站营销seo方案
  • 小程序代理模板广东seo网站推广代运营
  • thinkphp网站优化长沙互联网推广公司
  • 奥远科技网站建设流程百度网盘资源链接入口
  • 微网站首选公司seo学徒
  • 网站制作公司哪里好优秀营销软文范例800字
  • 做网站的外包公司上班好不好朋友圈广告30元 1000次
  • 用web做网站百度收录查询工具
  • 苏州海外建站公司魔方优化大师官网
  • 河南重大项目建设网站免费访问国外网站的app
  • 贵阳做网站开发科技有限公司产品推广计划怎么写
  • 小网站靠什么挣钱搜索引擎优化自然排名的优点
  • 网站颜色搭配技巧网站定制
  • 做网站为什么先交定金余姚网站制作公司
  • 成品网站w灬源码三叶草百度导航2023年最新版
  • 聊城做网站推广公司百度关键词优化大
  • 西安那里做网站好网站
  • 用wordpress搭建搜索优化整站优化
  • 网站建设静态部分报告总结百度企业号
  • 做网站包括什么软文写作平台发稿
  • 做网站的大型公司郑州seo顾问培训
  • 网站被电脑管家拦截做301跳转怎么自己注册网站
  • 长沙网络营销网站建设网络营销的产品策略
  • 在网站怎么做收款二维码什么是搜索推广