当前位置: 首页 > wzjs >正文

小企业网站价格工程建设管理网站

小企业网站价格,工程建设管理网站,凡客陈年现状,国内视频网站域名决策树模型(Decision Tree)详解 决策树是一种树形结构的监督学习模型,通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程,通过不断提问(基于特征划分)逐步逼近答案。1. 核心概念 节点类型…

决策树模型(Decision Tree)详解

决策树是一种树形结构的监督学习模型,通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程,通过不断提问(基于特征划分)逐步逼近答案。


1. 核心概念
  • 节点类型
    • 根节点:起始问题(最佳特征划分点)。
    • 内部节点:中间决策步骤(特征判断)。
    • 叶节点:最终预测结果(类别或数值)。
  • 分支:对应特征的取值或条件判断(如“年龄≥30?”)。

2. 构建决策树的关键步骤
(1) 特征选择

选择最优特征进行划分,常用准则:

  • 分类任务

  • 回归任务

    • 均方误差(MSE)最小化:选择使子节点方差下降最多的特征。
(2) 划分停止条件
  • 当前节点样本属于同一类别。
  • 样本数少于预设阈值(如min_samples_split=5)。
  • 树的深度达到最大值(max_depth)。
(3) 剪枝(防止过拟合)
  • 预剪枝:在划分前评估,若划分不能提升性能则停止。
  • 后剪枝:先生成完整树,再自底向上剪枝(如CCP方法)。

3. 决策树示例

问题:预测是否批准贷款。
特征:年龄、收入、信用评分。
树结构

  1. 根节点:信用评分 ≥ 650?
    • 是 → 叶节点:批准。
    • 否 → 内部节点:收入 ≥ 50k?
      • 是 → 叶节点:批准。
      • 否 → 叶节点:拒绝。

4. 代码实现
(1) Scikit-learn分类树
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris# 加载数据
data = load_iris()
X, y = data.data, data.target# 训练模型
clf = DecisionTreeClassifier(criterion='gini', max_depth=3)
clf.fit(X, y)# 可视化树
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt
plt.figure(figsize=(12, 8))
plot_tree(clf, filled=True, feature_names=data.feature_names, class_names=data.target_names)
plt.show()

决策树可视化

(2) Scikit-learn回归树
from sklearn.tree import DecisionTreeRegressor
from sklearn.datasets import fetch_california_housingdata = fetch_california_housing()
X, y = data.data, data.targetreg = DecisionTreeRegressor(max_depth=2)
reg.fit(X, y)

5. 优缺点对比
优点缺点
1. 可解释性强:规则直观易懂。1. 容易过拟合:需剪枝或限制深度。
2. 无需特征缩放:对数据分布不敏感。2. 不稳定:数据微小变化可能导致树结构剧变。
3. 处理混合类型数据:数值和类别特征均可。3. 偏向多值特征:信息增益可能偏好取值多的特征。

6. 进阶应用
(1) 集成方法
  • 随机森林(Random Forest):多棵决策树投票,降低方差。
  • 梯度提升树(GBDT/XGBoost):逐步修正前序树的误差。
(2) 多输出任务
  • 支持同时预测多个目标(如分类+回归)。
(3) 解释工具
  • SHAP值:量化特征对单样本预测的影响。
    import shap
    explainer = shap.TreeExplainer(clf)
    shap_values = explainer.shap_values(X)
    shap.summary_plot(shap_values, X, feature_names=data.feature_names)
    

7. 关键参数调优
参数作用常用值
max_depth控制树的最大深度3-10(防过拟合)
min_samples_split节点分裂所需最小样本数2-5
min_samples_leaf叶节点最少样本数1-5
criterion分裂标准(基尼/熵/均方误差)gini(分类)

8. 总结
  • 决策树本质:通过递归划分特征空间实现预测。
  • 适用场景
    • 需要可解释性的业务(如金融风控、医疗诊断)。
    • 小规模数据集或特征含义明确的任务。
  • 升级方向:集成学习(如随机森林、XGBoost)提升性能。

文章转载自:

http://TA8HH29j.ryrpq.cn
http://IJspkOgI.ryrpq.cn
http://S08Pnqr1.ryrpq.cn
http://oodRIfYE.ryrpq.cn
http://ShsBNhZb.ryrpq.cn
http://yO4xjk0x.ryrpq.cn
http://Muk9XOeG.ryrpq.cn
http://PkPteTos.ryrpq.cn
http://6oDeDl0j.ryrpq.cn
http://E7hRYLS3.ryrpq.cn
http://cAVZEUvo.ryrpq.cn
http://KROxFRZu.ryrpq.cn
http://c5FuMUPt.ryrpq.cn
http://3LRW5hhK.ryrpq.cn
http://sZO0BN5z.ryrpq.cn
http://DYTGFkn4.ryrpq.cn
http://gKAwXQ8q.ryrpq.cn
http://DU0hPPRI.ryrpq.cn
http://s7pjpvVw.ryrpq.cn
http://fNi6fPYQ.ryrpq.cn
http://3ns8p0QR.ryrpq.cn
http://Uak0umLc.ryrpq.cn
http://93umeAWp.ryrpq.cn
http://9buWRwLQ.ryrpq.cn
http://Fimf3QET.ryrpq.cn
http://gbySglQN.ryrpq.cn
http://tNWjJWVs.ryrpq.cn
http://6muspPLd.ryrpq.cn
http://ZZucWumK.ryrpq.cn
http://4bR8Vxye.ryrpq.cn
http://www.dtcms.com/wzjs/696814.html

相关文章:

  • 提卡网站要怎么做做网站样品图片怎么拍照
  • 长沙网站制作公司有哪些网站代理登录域名
  • 网站建设涉及的知识产权wordpress婚礼主题
  • 做网站下载那个数据库好怎么给wordpress加背景图
  • 宁波微网站建设电子商务网站建设指导书
  • 网站建设谢辞加强统计局网站的建设和管理
  • cdn网站加速 免备案网站做生鲜线下推广建议
  • 建个短视频网站网络营销就业方向
  • 网站开发开发只做正品的购物网站
  • 济南做网站的哪家好软件开发培训机构价格
  • 网站制造宿州高端网站建设公司
  • html好看的网站的代码两学一做网站是多少钱
  • 娱乐网站建设ppt模板镇江网页设计工作室
  • 西宁网站怎么做seowordpress弹出式表单
  • 四川建设厅官方网站证书查询美术生十大最烂专业
  • 做地方房产网站怎么样大学网站开发
  • 做+淘宝客最大的网站是叫什么怎么做app网站ui原型
  • js网站下拉置顶代码wordpress 域
  • 积分支付 WordPress佛山百度关键词seo外包
  • 公司 网站源码网站开发薪酬
  • 怎样在百度上作网站推广服务器中安装网站
  • 盐城网站建设代理商网站备案安全责任书是谁盖章
  • 企业服务建设网站网站规划与建设大作业答案
  • 建立网站费用较低企点官网
  • 山东省城乡住房和城乡建设厅网站笑话网站 wordpress
  • 成功的企业网站案例我想做电商怎么加入
  • 京东的网站是怎么建设的网站技术维护
  • 可以免费发广告的网站wordpress添加导航栏
  • 做网站应该注意什么做企业网站找谁
  • WordPress显示网站加载时间wordpress 图片云存储