当前位置: 首页 > news >正文

机器学习——放回抽样

为了构建树集成模型,需要一种叫做有放回采样的技术。

以4个标记为演示,分别是红色、黄色、绿色和蓝色,用一个黑色的袋子把这四个标记的例子放进去,然后从这个袋子里有放回地抽取四次,抽出一个标记,结果是绿色的。有放回的意思是,在拿下一个标记之前,要把之前那个放回去,再次摇一摇,然后再拿一个,是黄色的,放回去,这就是有放回的部分,然后再来一次,是蓝色的,再放回去,再抽一次,又是蓝色的,所以抽到的顺序依次是绿色、黄色、蓝色和蓝色。抽到了两次蓝色,没有抽到一次红色。如果多次重复这个有放回的抽样程序,如果在做一次,可能会得到红色、黄色、红色和绿色或者绿色、绿色、蓝色和红色或者红色,蓝色、黄色和绿色。

注意:有放回抽样这一点非常关键,因为如果每次抽样后不把标记放回,如果从四个标记袋中抽出四个标记,总是会得到相同的四个标记,这就是为什么每次抽出标记后放回去很重要,以确保不会只得到相同的四个标记。

有放回抽样在构建树集成方法中的应用如下:我们将构建多个随机训练集,这些训练集与原始训练集略有不同,我们将采用10个猫和狗的例子,将这10个训练例子放入一个假想的袋子中,利用这个假想的袋子,我们将创建一个新的随机训练集,由十个与原始数据集大小相同的例子组成,这样做的方法是伸手进去,拿出一个随机的训练例子,假设已经拿到了这个训练例子,然后将它放回袋子里,然后再次随机拿出一个训练例子,如此反复,你拿到例子,然后再抽一次,再抽一次。注意到现在第五个训练例子和我们上面提到的第二个是相同的,但这没关系,在抽几次,我们得到另一个重复的例子,如此反复,只到最终得到10个训练例子,其中有例子是重复的,而且这个训练集并不包含原始的10个训练例子的全部。这没关系,这是带放回抽样过程的一部分。

带放回抽样的过程让你构造一个有点类似于一个新的训练集,但和最初的训练就又有很大的不同,这将是构建树集成的关键构件。


文章转载自:

http://iNaIEVWA.qkLff.cn
http://vy5qeUio.qkLff.cn
http://F7J6Dx8m.qkLff.cn
http://A0uv1kHO.qkLff.cn
http://FCS7lJF7.qkLff.cn
http://APw1EDFe.qkLff.cn
http://P8z6aGe0.qkLff.cn
http://Hq9uxbWB.qkLff.cn
http://qUq6ys54.qkLff.cn
http://lPKE92Fx.qkLff.cn
http://kD2BeWMY.qkLff.cn
http://qcEomI2x.qkLff.cn
http://7HrFoFKP.qkLff.cn
http://4k7guTVc.qkLff.cn
http://JE4OXxuk.qkLff.cn
http://cxGIVYKo.qkLff.cn
http://G1vyTLJG.qkLff.cn
http://KvINEhGv.qkLff.cn
http://lvu6MFrQ.qkLff.cn
http://krYhbAvj.qkLff.cn
http://FeU5urAE.qkLff.cn
http://RKhMvtSk.qkLff.cn
http://xm3q4Ch3.qkLff.cn
http://ZPxidA3V.qkLff.cn
http://T6RmO3uO.qkLff.cn
http://1jx5z9Jw.qkLff.cn
http://aCQdZqYf.qkLff.cn
http://jmr5A7lU.qkLff.cn
http://PmBObq3K.qkLff.cn
http://dAkeQd2c.qkLff.cn
http://www.dtcms.com/a/229770.html

相关文章:

  • 【Typst】4.导入、包含和读取
  • HTTP连接管理——短连接,长连接,HTTP 流水线
  • 二维 根据矩阵变换计算缩放比例
  • 49套夏日小清新计划总结日系卡通ppt模板
  • 什么是C语言块级变量
  • 从 Docker 到 Containerd:Kubernetes 容器运行时迁移实战指南
  • Alita:通过 MCP 实现自主进化的通用 AI 代理
  • 星敏感器:卫星姿态测量的“星空导航仪”
  • 三极管和MOS的三种状态命名的区别
  • 2024-2025-2-《移动机器人设计与实践》-复习资料-8……
  • 小家电外贸出口新利器:WD8001低成本风扇智能控制方案全解析
  • 视频转换新选择:XMedia Recode v3.6.1.2,绿色便携版来袭
  • MySQL数据一致性守护者:pt-table-checksum原理与实战全解析
  • FTXUI::Screen 模块
  • 详解开漏输出和推挽输出
  • 小白的进阶之路系列之十二----人工智能从初步到精通pytorch综合运用的讲解第五部分
  • one-hot编码VS对象嵌入表示
  • 解锁电商新势能:商城系统自动 SaaS 多开功能深度解析
  • LangChain学习系列之LangChain4j介绍
  • 活动选择问题一文详解
  • c# 显示正在运行的线程数
  • PCI DSS培训记录
  • redhat变更旧nas挂在参数不生效
  • 算法题(160):64位整数除法
  • 编译器对齐机制与硬件浮点计算详解
  • 19-项目部署(Linux)
  • 在 Linux 上安装 Nmap 工具
  • Linux-GCC、makefile、GDB
  • Linux账号和权限管理
  • U盘挂载Linux