当前位置: 首页 > wzjs >正文

厦门网站公司无锡网站建设优化公司

厦门网站公司,无锡网站建设优化公司,北京建设工程造价信息网,网站开发环境实验报告文章目录一、前言二、数据划分方法1. 留出法(Hold-out)2. K折交叉验证(K-Fold)3. 留一法(Leave-One-Out)三、总结一、前言 简要介绍数据划分在机器学习中的作用。 二、数据划分方法 1. 留出法&#xff0…

文章目录

    • 一、前言
    • 二、数据划分方法
      • 1. 留出法(Hold-out)
      • 2. K折交叉验证(K-Fold)
      • 3. 留一法(Leave-One-Out)
    • 三、总结

一、前言

简要介绍数据划分在机器学习中的作用。

二、数据划分方法

1. 留出法(Hold-out)

  • 使用 train_test_split 将数据分为训练集和测试集。
  • 代码片段:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=0)
print('Train obs: ', len(X_train))
print('Test obs: ', len(X_test))

2. K折交叉验证(K-Fold)

  • 用 KFold 将数据分为多折,循环训练和测试。
  • 代码片段:
from sklearn.model_selection import KFold
X = np.random.randn(20, 1)
# 创建一个KFold对象,将数据分为5份,shuffle=True表示在分割前会先打乱数据
# 设置一个random state保证每次打乱的结果一致
kf = KFold(n_splits=5, shuffle=True, random_state=10)
#kf.get_n_splits(X)
for train_index, test_index in kf.split(X):print(train_index, test_index)
# 创建一个KFold对象,将数据分为5份,不打乱数据
kf = KFold(n_splits=5, shuffle=False)
#kf.get_n_splits(X)
for train_index, test_index in kf.split(X):print(train_index, test_index)    

在这里插入图片描述
Note:假设总共有N个样本,K折交叉验证会将数据平均分成K份。每一折中,test_index的数量大约是 N/K(如果N不能被K整除,有的折会多一个或少一个),其余的样本作为训练集,train_index的数量就是N- test_index 的数量。在本例中,test_index的数量是20/5=4。

3. 留一法(Leave-One-Out)

  • 每次留一个样本做测试,其余做训练。
  • 代码片段:
from sklearn.model_selection import LeaveOneOut
loo = LeaveOneOut()
loo.get_n_splits(X)
for train_index, test_index in loo.split(X):print(train_index, test_index)

在这里插入图片描述

三、总结

方法名称主要思想sklearn实现训练集数量测试集数量适用场景与特点
留出法随机划分一部分做训练,其余做测试train_test_split设定比例(如60%)设定比例(如40%)简单高效,适合大数据集
K折交叉验证将数据均分为K份,轮流做测试KFoldN-N/KN/K评估更稳定,适合中小数据集
留一法每次留一个样本做测试,其余训练LeaveOneOutN-11适合样本量较小的情况

说明:

  • 训练集数量和测试集数量均为占总样本数的比例或数量。
  • K折法和留一法属于交叉验证,能更全面评估模型性能。
  • 留出法实现简单,适合数据量较大时快速实验。

参考:https://scikit-learn.org/stable/api/sklearn.model_selection.html

博客内容如有错误欢迎指正~
在这里插入图片描述

http://www.dtcms.com/wzjs/527456.html

相关文章:

  • 购买网站域名怎么做会计分录学seo优化
  • 软件工作室网站模板seo外链优化策略
  • 网站备案 历史seo chinaz
  • 建设集团网站报告书现在有哪些培训学校
  • 股票开户seo优化外包公司
  • 站长平台seo北京百度推广公司
  • html5做的网站百度识图在线使用一下
  • 延安网站开发搜狗网址导航
  • 商标免费查询官网东莞seo黑帽培训
  • 网站建设 深圳软文营销文章
  • 什么样算网站需要备案石家庄百度seo
  • 电商网站开发过程搜一搜站长工具
  • 织梦个人网站模板网店运营推广方案
  • wordpress调用幻灯片青岛seo搜索优化
  • 公司做网站费用seo项目是什么
  • 网站建设和技术支持怎么在网上做广告
  • 接网站制作怎么打开网站
  • 如何做游戏试玩网站广州谷歌优化
  • 网站系统源码站长素材免费下载
  • 网站建设文案全国疫情高峰时间表最新
  • 私人做网站要多少钱平台交易网
  • 网上做一道题2元的网站51趣优化网络seo工程师教程
  • 网购哪个网站最好网络营销与网站推广的区别
  • 哪些域名适合营销型网站大数据培训机构排名前十
  • 做网站go和php用哪个好石家庄seo结算
  • 北京网站优化推广分析如何进入网站
  • 网页设计和网站开发有什么区别北京百度seo排名点击软件
  • 宝山青岛网站建设做seo网页价格
  • 学校网站制作多少钱百度问答seo
  • axure怎么做优酷网站5188大数据官网