当前位置: 首页 > news >正文

模型训练相关的问题

与模型训练相关问题

    • 损失函数Cross entropy loss的含义
    • 训练数据有脏数据,怎么处理?
    • loss一直不收敛,怎么排查?
    • 连续值的特征怎么处理后输入到机器学习模型当中

损失函数Cross entropy loss的含义

在深度学习中,可以看作通过概率分布q ( x )(预测概率)表示概率分布p ( x ) (label)
在这里插入图片描述物理意义:可以理解为在相对熵中,一个目标事件已确定(label),求另一个概率分布到目标概率分布的距离

训练数据有脏数据,怎么处理?

判断脏数据的类型,然后对症下药
a) 缺失值:删除、填充、插值。
b) 重复数据:删除。
c) 异常值:删除、修正、保留。
d) 噪声数据:平滑、数据清洗。
e) 类别数据:合并稀有类别、标签一致化。
f) 文本数据:拼写纠正、去除停用词、标准化。
g) 数据标准化/归一化:确保数据具有合适的尺度。

loss一直不收敛,怎么排查?

a) 学习率过大或过小:尝试使用学习率调度器,逐步减少学习率࿰

http://www.dtcms.com/a/225202.html

相关文章:

  • CFTel:一种基于云雾自动化的鲁棒且可扩展的远程机器人架构
  • 实现RabbitMQ多节点集群搭建
  • 初学者如何微调大模型?从0到1详解
  • 基于Python与本地Ollama的智能语音唤醒助手实现
  • RV1126-OPENCV 图像叠加
  • Rust 学习笔记:发布一个 crate 到 crates.io
  • 性能优化 - 工具篇:基准测试 JMH
  • 性能优化 - 案例篇:数据一致性
  • NX753NX756美光科技闪存NX784NX785
  • QuickJS 如何计算黄金分割率 ?
  • Microsoft Fabric - 尝试一下Data Factory一些新的特性(2025年5月)
  • 【前端】成长路线
  • day16 leetcode-hot100-32(链表11)
  • AI视频“入驻”手机,多模态成智能终端的新战场
  • DQN和DDQN(进阶版)
  • maven中的maven-antrun-plugin插件详解
  • comfyui利用 SkyReels-V2直接生成长视频本地部署问题总结 1
  • 设计模式——模版方法设计模式(行为型)
  • 开源库免费API服务平台 ALLBEAPI
  • Notepad++找回自动暂存的文件
  • 【C/C++】面试常考题目
  • robot_lab学习笔记【MDP综述】
  • 学习BI---BI看板的生命周期
  • 鸿蒙HarmonyOS —(cordova)研发方案详解
  • 仓颉鸿蒙开发:制作底部标签栏
  • 鸿蒙OS基于UniApp的WebRTC视频会议系统实践:从0到1的HarmonyOS适配之路#三方框架 #Uniapp
  • Spring Boot 中的 Web 应用与 Reactive Web 应用
  • React 路由管理与动态路由配置实战
  • Java中的JSONObject详解:从基础到高级应用
  • 【数据结构】图的存储(十字链表)