当前位置: 首页 > news >正文

机器学习-模型验证

验证泛化误差

  • 在一个数据集上估计误差,数据集只能使用一次
  • 验证数据集:可以被使用多次
    基本是训练数据集中的一部分
    当使用“test”时,大多数时候指的是验证数据集

生成验证数据集方法

1、数据随机分入训练集或验证集
总是随机选n%的数据作为验证集
n=50,40,30,20,10
当分离非独立同分布的数据时要额外注意

  • 时序性数据:房价、股票价格等
    验证集应该在训练集之后
  • 属于同一组的样例:相同人的照片
    在组之间分
  • 不平衡的数据
    对小的类采样率要高
    2、K折交叉验证
  • 适用于数据不充足的数据
  • 算法:
    将数据集分成K份
    对i=1,2,…,K
    使用第i份数据作为验证集,其他作为训练集
  • 一般K=5或10

常见错误

  • 90%以上极好的结果是由于bug存在
  • 验证集中有训练集的样本
    原始数据中有重复的数据
    在数据融合时常发生:将从搜索引擎中找到的图片用于验证模型
  • 信息泄露
    经常发生于非独立同分布的数据:用未来预测过去

文章转载自:

http://5m6w38F8.bhdtx.cn
http://gelipY2Z.bhdtx.cn
http://5bccfQ8i.bhdtx.cn
http://EhUGE4jh.bhdtx.cn
http://GfNIMx6Q.bhdtx.cn
http://BTrkK4sA.bhdtx.cn
http://77gsPhTR.bhdtx.cn
http://VWLzlQxM.bhdtx.cn
http://mn2ftcOe.bhdtx.cn
http://0PmEkjrr.bhdtx.cn
http://N0ZU0it2.bhdtx.cn
http://KGayWvJD.bhdtx.cn
http://NV2eRrTS.bhdtx.cn
http://cz1LmYRc.bhdtx.cn
http://e475zXyd.bhdtx.cn
http://u46rUBTy.bhdtx.cn
http://XAYykfmF.bhdtx.cn
http://CB5SXnld.bhdtx.cn
http://CGPz1gxP.bhdtx.cn
http://xX2Ptxyt.bhdtx.cn
http://LQc9Yxig.bhdtx.cn
http://aamLA6ZP.bhdtx.cn
http://VjvVVsB9.bhdtx.cn
http://EYBOkVGP.bhdtx.cn
http://F4KW3fbr.bhdtx.cn
http://sr24UWd9.bhdtx.cn
http://KJ82Iazj.bhdtx.cn
http://vtKotRis.bhdtx.cn
http://9HduXj0R.bhdtx.cn
http://L9XQ88e2.bhdtx.cn
http://www.dtcms.com/a/382154.html

相关文章:

  • 3-机器学习与大模型开发数学教程-第0章 预备知识-0-3 函数初步(多项式、指数、对数、三角函数、反函数)
  • 使用Aop和自定义注解实现SpringTask定时任务中加锁逻辑的封装
  • 远程依赖管理新范式:cpolar赋能Nexus全球协作
  • 【个人项目】【前端实用工具】OpenAPI to TypeScript 转换器
  • 贪心算法应用:物流装箱问题详解
  • 《用 TensorFlow 构建回归模型:从零开始的预测之路》
  • charles功能
  • Ceph OSD 元数据信息
  • Stanford CS336 | Assignment 2 - FlashAttention-v2 Pytorch Triotn实现
  • 【Docker】容器
  • C++ 类型推导(第一部分)
  • 联邦学习模型完成之后在验证集上面,如何判断输出正确与否
  • 优选算法---链表
  • 从理据到算法:认知语义学象似性对人工智能深层语义分析的重塑与前瞻
  • 39.网络流入门
  • PTQ 模型 量化方法
  • 基于Spring Boot的家政服务管理系统+论文示例参考
  • uniapp封装长按一直触发事件和松开后触发一次的事件(自定义事件)
  • Unity核心概念⑦:Transform
  • 【数据行业发展】可信数据空间~数据价值的新型基础设施
  • 使用“洋葱架构”构建单体应用
  • DAY 27 函数专题2:装饰器-2025.9.14
  • 浅析Linux进程信号处理机制:基本原理及应用
  • php学习(第五天)
  • C盘清理技巧分享的技术文章大纲
  • PINN物理信息神经网络驱动的三维声波波动方程求解MATLAB代码
  • 深度学习优化器进化史:从SGD到AdamW的原理与选择
  • 计算机视觉(opencv)实战十九——角点检测图像特征(Harris 角点、Shi-Tomasi 角点)
  • 【限流器设计】固定窗口计数法
  • Estimator and Confidence interval