当前位置: 首页 > wzjs >正文

什么网站可以做2.5D场景网站建设易客

什么网站可以做2.5D场景,网站建设易客,怎么看关键词的搜索量,做网站做系统一样么随机森林(Random Forest)是一种基于决策树的集成学习算法,它通过构建多个决策树并将它们的预测结果进行综合,从而提高模型的准确性和稳定性。 1.基本原理 随机森林属于集成学习中的“Bagging”方法。其核心思想是通过构建多个决…

随机森林(Random Forest)是一种基于决策树的集成学习算法,它通过构建多个决策树并将它们的预测结果进行综合,从而提高模型的准确性和稳定性。

1.基本原理

随机森林属于集成学习中的“Bagging”方法。其核心思想是通过构建多个决策树,并将它们的预测结果进行投票或平均,从而得到最终的预测结果。

 具体步骤如下:

数据采样:从原始训练数据集中随机有放回地抽取多个子样本(Bootstrap Sampling),每个子样本的大小与原始数据集相同。

特征选择:在构建每个决策树时,每次分裂节点时随机选择一部分特征(通常是总特征数的平方根个),而不是使用所有特征。这增加了决策树之间的多样性。

构建决策树:对每个子样本使用随机选择的特征构建决策树,决策树的构建过程通常不需要剪枝(即树可以生长到最大深度)。

集成预测:对于分类问题,通过多数投票法确定最终预测类别;对于回归问题,通过取平均值确定最终预测值。

2.参数调整

随机森林的主要参数包括:

决策树的数量(n_estimators):决策树的数量越多,模型的性能通常越好,但同时也会增加训练和预测的时间和空间开销。一般需要通过交叉验证来选择合适的数量。

最大深度(max_depth):限制决策树的最大深度,可以防止过拟合,但过小的深度可能会导致欠拟合。

最大特征数(max_features):每次分裂节点时随机选择的特征数量,通常设置为总特征数的平方根或对数。

最小叶节点样本数(min_samples_leaf):叶节点所需的最小样本数量,用于控制决策树的生长,防止过拟合。

最小分裂节点样本数(min_samples_split):分裂内部节点所需的最小样本数量,同样用于防止过拟合。

通过合理调整这些参数,可以优化随机森林模型的性能,使其在不同的数据集和应用场景中表现出色。

3.模型应用

  1. 引入必要模块
    import numpy as np
    import pandas as pd
    from sklearn.ensemble import RandomForestClassifier
    from sklearn.model_selection import train_test_split
    from sklearn.metrics import accuracy_score, classification_report
  2. 首先通过numpy的随机数生成函数编造了包含学生平时作业成绩、模拟考成绩、出勤天数这几个特征的数据,一共 100 条记录,并根据这些特征计算出一个虚拟的总分,依据总分设定了是否通过考试的目标标签(target)。
    # 编造数据集,假设包含学生的平时作业成绩、模拟考成绩、出勤天数等特征,共100条数据
    np.random.seed(42)
    n_samples = 100
    homework_scores = np.random.randint(0, 100, n_samples)
    mock_exam_scores = np.random.randint(0, 100, n_samples)
    attendance_days = np.random.randint(0, 100, n_samples)# 假设总分大于等于60分算通过考试,生成目标标签
    total_scores = homework_scores + mock_exam_scores + attendance_days
    target = np.where(total_scores >= 60, 1, 0)
    
  3. 然后将数据整理成pandasDataFrame格式,划分出特征矩阵X和目标向量y
    # 构建DataFrame
    data = pd.DataFrame({'homework_scores': homework_scores,'mock_exam_scores': mock_exam_scores,'attendance_days': attendance_days,'target': target
    })
  4. 接着使用train_test_split函数将数据划分为训练集和测试集,按照 80% 训练、20% 测试的比例进行划分。
    # 划分特征和目标变量
    X = data[['homework_scores','mock_exam_scores', 'attendance_days']]
    y = data['target']# 划分训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  5. 之后构建了一个随机森林分类模型,设置了决策树数量为 100 棵,并传入随机种子保证可复现性,使用训练集数据对模型进行训练。
    # 构建随机森林分类器
    rf_model = RandomForestClassifier(n_estimators=100, random_state=42)# 训练模型
    rf_model.fit(X_train, y_train)
  6. 最后在测试集上进行预测,并通过计算准确率以及输出更详细的分类报告(包含精确率、召回率、F1 值等指标)来评估模型的性能。
    # 在测试集上进行预测
    y_pred = rf_model.predict(X_test)# 评估模型
    accuracy = accuracy_score(y_test, y_pred)
    print("准确率:", accuracy)
    print("分类报告:")
    print(classification_report(y_test, y_pred))

4.模型评价

优点

高准确性:通过集成多个决策树,随机森林能够显著提高模型的预测性能,尤其在处理复杂数据集时表现优异。

抗过拟合能力:由于随机森林在构建过程中引入了样本和特征的随机性,相比单棵决策树,它对噪声和异常值的鲁棒性更强,不容易过拟合。

可处理多种类型的数据:随机森林可以处理数值型和分类型特征,无需对数据进行复杂的预处理。

特征重要性评估:随机森林能够计算特征的重要性,帮助识别对预测目标最有影响的特征,为特征选择和数据理解提供依据。

并行化处理:由于每个决策树的构建是独立的,随机森林可以并行化处理,大大提高了训练效率。

缺点

模型复杂度高:随机森林由多个决策树组成,模型结构复杂,训练和预测的时间和空间开销较大,尤其是当决策树的数量较多时。

可解释性差:虽然单棵决策树具有很好的可解释性,但随机森林由于是由多个决策树集成而成,整体的可解释性相对较弱,难以直观地理解模型的决策过程。

对数据不平衡敏感:在处理类别不平衡的数据集时,随机森林可能会偏向于多数类,导致对少数类的预测性能较差。


文章转载自:

http://CxNUvDij.qrmry.cn
http://dpWI6Gzv.qrmry.cn
http://jhXcC1em.qrmry.cn
http://FK3h4IF6.qrmry.cn
http://mdjXZEjl.qrmry.cn
http://f4JOTHbb.qrmry.cn
http://R1qEEfOA.qrmry.cn
http://Nj2kK4if.qrmry.cn
http://miOg0J89.qrmry.cn
http://2DXpOg7W.qrmry.cn
http://4Si2VCkD.qrmry.cn
http://ICFglr0F.qrmry.cn
http://sCHcrGgz.qrmry.cn
http://ZPwiJ4AM.qrmry.cn
http://fdSNZSEC.qrmry.cn
http://wcQ2QzQy.qrmry.cn
http://YgzIo2VG.qrmry.cn
http://8orVnCRp.qrmry.cn
http://Pd2GpV94.qrmry.cn
http://VCQKVo5W.qrmry.cn
http://gkoXzcRm.qrmry.cn
http://g0JQiDGk.qrmry.cn
http://WU8Ltke3.qrmry.cn
http://RFn0rhyd.qrmry.cn
http://j9GAwrG6.qrmry.cn
http://fWNUMWhy.qrmry.cn
http://bq8aWAsk.qrmry.cn
http://2uxPh1mN.qrmry.cn
http://8dd2itse.qrmry.cn
http://ktwAXBcj.qrmry.cn
http://www.dtcms.com/wzjs/764103.html

相关文章:

  • 做网站的框架组合长沙网站关键词排名推广公司
  • 包装设计网站哪个好用怎么做网站教程 建站视频
  • 做智能网站系统下载中方建设局网站
  • 济南手机网站定制费用外国人做那个视频网站吗
  • 旅游网站课程设计东莞长安做网站公司
  • 食品 技术支持 东莞网站建设咸阳网站建设多少钱
  • 一个空间怎么做两个网站 跳转德芙巧克力软文推广
  • 寺庙做网站怎么做简历的网站
  • 沂源手机网站建设公司娃哈哈网络营销策划方案
  • 如何做好区县外宣网站建设排版设计英文
  • 专业网站建设经费申请报告信息流广告投放是什么
  • 2017网站开发就业前景公司做网站的好处
  • 哈尔滨住房城乡建设局网站首页如何做伪原创文章网站
  • 中山快速建站合作seo的网站建设
  • 网站建设软件 优帮云whcms wordpress
  • wordpress电台绍兴seo计费
  • 手机网站模版 优帮云营销网站建设的原则
  • 兼职网站开发团队工作项目总结绵阳市网站建立
  • 那些小网站是哪里人做的wordpress心得体会
  • 家居企业网站建设流程公司广告百度推广
  • 网站访问速度慢的原因宁德网站建设公司
  • 内蒙古建设协会网站个人做网站如何赚钱吗
  • 企业官方网站怎么写烟台网站建设技术托管
  • 免费国外建站h5开发工具哪个好
  • 如何在对方网站上做外链提供网站制作公司哪家专业
  • 新房地产网站开发html页面 wordpress
  • 什么网站可以做兼职WordPress会员注册管理
  • 南京网站制作做网站用那一种语言最好
  • 外贸网站搭建推广怎么在本地安装wordpress
  • 外贸网站建设是什么黄江镇网站建设