当前位置: 首页 > news >正文

编程小白冲Kaggle每日打卡(12)--kaggle学堂:<机器学习简介>模型如何工作

Kaggle官方课程链接:How Models Work

本专栏旨在Kaggle官方课程的汉化,让大家更方便地看懂。

How Models Work

第一步,如果你是机器学习的新手。

Introduction

我们将从概述机器学习模型的工作原理和使用方法开始。如果你以前做过统计建模或机器学习,这可能会让你觉得很基本。别担心,我们很快就会建立强大的模型。

本课程将让您在经历以下场景时构建模型:

你表哥通过房地产投机赚了数百万美元。由于你对数据科学的兴趣,他主动提出与你成为商业伙伴。他会提供资金,你会提供预测各种房屋价值的模型。

你问你的堂兄过去是如何预测房地产价值的,他说这只是直觉。但更多的质疑表明,他从过去见过的房子中识别出了价格模式,并利用这些模式对他正在考虑的新房进行了预测。

机器学习的工作原理是一样的。我们将从一个名为决策树的模型开始。有更高级的模型可以给出更准确的预测。但是决策树很容易理解,它们是数据科学中一些最佳模型的基本构建块。

为了简单起见,我们将从最简单的决策树开始。

它将房屋分为两类。所考虑的任何房屋的预测价格都是同类房屋的历史平均价格。

我们使用数据来决定如何将房屋分为两组,然后再次确定每组的预测价格。从数据中捕获模式的这一步骤称为拟合或训练模型。用于拟合模型的数据称为训练数据。

模型如何拟合的细节(例如如何分割数据)足够复杂,我们将稍后保存。模型拟合后,您可以将其应用于新数据,以预测额外房屋的价格。

Improving the Decision Tree

以下两个决策树中,哪一个更有可能是拟合房地产训练数据的结果?

左边的决策树(决策树1)可能更有意义,因为它捕捉到了这样一个现实,即卧室更多的房子往往比卧室更少的房子售价更高。这种模型最大的缺点是它没有捕捉到影响房价的大多数因素,如浴室数量、地块大小、位置等。

你可以使用具有更多“分裂”的树来捕捉更多的因素。这些被称为“更深”的树。一个同时考虑每栋房子地块总面积的决策树可能看起来像这样:

你可以通过追踪决策树来预测任何房子的价格,总是选择与房子特征相对应的路径。这房子的预测价格是最低的。我们做出预测的底部点称为叶子。

叶子处的分割和值将由数据决定,因此是时候检查您将使用的数据了。

Continue

让我们更具体一点。是时候检查你的数据了。

相关文章:

  • 《论模型驱动架构设计方法及其应用》审题技巧 - 系统架构设计师
  • 为AI聊天工具添加一个知识系统 之117 详细设计之58 思维导图及观察者效应 之2 概念全景图
  • 深入剖析抽象工厂模式:设计模式中的架构利器
  • 【每日一算法】二分查找
  • 学习经验分享【39】YOLOv12——2025 年 2 月 19 日发布的以注意力为核心的实时目标检测器
  • vue2 和 vue3 中 computer 计算属性的用法
  • 单臂路由
  • 【算法系列】荷兰国旗问题:三指针法原地排序
  • comfy 面部修复(ComfyUI-Impact-Pack)
  • mybatis 细节(${ ..}和#{..},resultType 和 resultMap的区别,别名的使用,Mapper 代理模式)
  • vue-treeselect显示unknown的问题及解决
  • React 高阶组件的优缺点
  • CMake入门
  • HDFS Java 客户端 API
  • QML MouseArea 鼠标事件详解
  • SQLMesh 系列教程8- 详解 seed 模型
  • 每日一题——验证IP地址
  • Docker教程(喂饭级!)
  • 数字化电子(不动产经营租赁服务)发票版式文件说明
  • 孜然单授权系统V2.0PHP授权系统
  • 西甲上海足球学院揭幕,用“足球方法论”试水中国青训
  • 央行谈MLF:逐步退出政策利率属性回归流动性投放工具
  • 大四本科生已发14篇SCI论文?重庆大学:成立工作组核实
  • 中方对原产印度进口氯氰菊酯实施反倾销措施,商务部回应
  • 央行:5月15日起下调金融机构存款准备金率0.5个百分点
  • 长和获准出售巴拿马运河港口以外的港口?外交部:该报道没有依据