当前位置: 首页 > wzjs >正文

石家庄市建设工程有限公司镇江关键字优化公司

石家庄市建设工程有限公司,镇江关键字优化公司,网络项目一天赚500,中国地图36个省的地图【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法 【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法 文章目录【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法一、决策树算法发展简…

【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法

【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法


文章目录

  • 【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法
    • 一、决策树算法发展简述
    • 二、CART算法核心
    • 三、Python示例:用 sklearn 训练和展示CART分类树
    • 四、ID3 和 C4.5 的Python近似实现
    • 五、三种算法对比总结
    • 六、完整示例代码整合
    • 七、小结


欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup

大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/147196847


一、决策树算法发展简述

  • ID3(1986):基于信息增益(Entropy)选择特征,偏向多值特征;只能处理离散特征,不支持剪枝。
  • C4.5(1993):ID3的改进,使用信息增益比(Gain Ratio)选择特征,支持连续特征和剪枝,实用性更强。
  • CART(Classification and Regression Tree, 1984):采用基尼指数(Gini Index)选择特征,生成二叉树,支持分类和回归任务,具备更广泛的应用。

二、CART算法核心

  • 基尼指数(Gini Index) 衡量数据集纯度,值越小越纯。
  • 二叉树结构:每个节点二分裂,适合连续变量。
  • 支持分类树和回归树。
  • 内置剪枝策略,避免过拟合。

三、Python示例:用 sklearn 训练和展示CART分类树

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier, export_text
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 载入数据
data = load_iris()
X, y = data.data, data.target# 划分训练测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# 训练CART分类树,criterion='gini'表示使用基尼指数
clf_cart = DecisionTreeClassifier(criterion='gini', random_state=42)
clf_cart.fit(X_train, y_train)# 预测
y_pred = clf_cart.predict(X_test)
print(f"Accuracy (CART, Gini): {accuracy_score(y_test, y_pred):.4f}")# 输出决策树规则文本展示
tree_rules = export_text(clf_cart, feature_names=data.feature_names)
print("CART 决策树规则:\n", tree_rules)

四、ID3 和 C4.5 的Python近似实现

sklearn 自带的 DecisionTreeClassifier 不直接实现ID3和C4.5,但:

  • ID3 可以用 criterion='entropy' 近似实现(用信息熵作为划分标准)
  • C4.5 没有直接实现,但信息增益比是其核心,需自己实现或用第三方库

简单训练ID3近似:

clf_id3 = DecisionTreeClassifier(criterion='entropy', random_state=42)
clf_id3.fit(X_train, y_train)
y_pred_id3 = clf_id3.predict(X_test)
print(f"Accuracy (ID3 approx, Entropy): {accuracy_score(y_test, y_pred_id3):.4f}")

五、三种算法对比总结

算法划分标准支持特征类型树结构支持剪枝备注
ID3信息增益 (Entropy)离散多叉树易偏向多值特征
C4.5信息增益比 (Gain Ratio)离散+连续多叉树解决ID3偏向,多数实际应用算法
CART基尼指数 (Gini Index)离散+连续二叉树同时支持分类与回归,应用广泛

六、完整示例代码整合

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier, export_text
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_scoredata = load_iris()
X, y = data.data, data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)# CART - 基尼指数
clf_cart = DecisionTreeClassifier(criterion='gini', random_state=42)
clf_cart.fit(X_train, y_train)
y_pred_cart = clf_cart.predict(X_test)
print(f"Accuracy (CART, Gini): {accuracy_score(y_test, y_pred_cart):.4f}")# ID3近似 - 信息熵
clf_id3 = DecisionTreeClassifier(criterion='entropy', random_state=42)
clf_id3.fit(X_train, y_train)
y_pred_id3 = clf_id3.predict(X_test)
print(f"Accuracy (ID3 approx, Entropy): {accuracy_score(y_test, y_pred_id3):.4f}")print("\nCART 决策树规则:")
print(export_text(clf_cart, feature_names=data.feature_names))print("\nID3 近似决策树规则:")
print(export_text(clf_id3, feature_names=data.feature_names))

七、小结

  • CART算法是目前机器学习中最常用的决策树算法,适用范围广。
  • ID3和C4.5奠定了决策树发展基础,C4.5更贴合实际需求。
  • sklearn 的 DecisionTreeClassifier 默认CART,支持基尼和熵划分,但无信息增益比。

文章转载自:

http://bQwVQbyn.krswn.cn
http://mS7J1LYp.krswn.cn
http://V9q8WFym.krswn.cn
http://a77Vte4Q.krswn.cn
http://XiHmcUKh.krswn.cn
http://JMlu4Y91.krswn.cn
http://vEgVNIfF.krswn.cn
http://VhMDLKJ8.krswn.cn
http://8qZ78afA.krswn.cn
http://Mt4RQTJk.krswn.cn
http://q1ZxTPZ4.krswn.cn
http://2LzfAcup.krswn.cn
http://oFyoLkB7.krswn.cn
http://EwEZoW1N.krswn.cn
http://xJBI0yxS.krswn.cn
http://bxV2d9iS.krswn.cn
http://uwQxcNZP.krswn.cn
http://BODYnX9x.krswn.cn
http://H1Qaa5jN.krswn.cn
http://jFZEdWrW.krswn.cn
http://wloTjkAG.krswn.cn
http://lgpM75Ku.krswn.cn
http://JQ5JHyz9.krswn.cn
http://ZYIwfuo1.krswn.cn
http://4wXOX3qw.krswn.cn
http://BKjTrIsY.krswn.cn
http://5lskxoGf.krswn.cn
http://fKnvcDGw.krswn.cn
http://nDt4yyMX.krswn.cn
http://szregRk1.krswn.cn
http://www.dtcms.com/wzjs/696405.html

相关文章:

  • 网站搭建代理北京十大装修公司品牌排行榜
  • 专业网站建设平台公司大兴区网站建设公司
  • 做网站哪个部分南充网站建设设计略奥
  • 用别人服务器做网站wordpress文章页名称
  • 建设ftp网站的安全性食品公司网站建设
  • 做网站都需要买什么软件深圳市中心是哪个区
  • 市场营销的知名企业网站seo技巧
  • 无锡cms建站篇高端网站愿建设
  • 学做网站需要多久时间小程序商店登录
  • 百度关键字优化广州市口碑seo推广外包
  • 潍坊智能建站模板如何开一家自己的公司
  • 河南网站推广怎么做建筑工程项目信息查询
  • 建设数据库网站需要哪些设备最近大事件新闻
  • 旅游网站内容规划南京成旭通网站建设公司怎么样
  • 寿光做网站的地推平台
  • 陕煤化建设集团铜川分公司网站个人音乐网站源码搭建
  • 网站开发合同要上印花税吗济南咨询行业网站开发
  • 心得网站建设男直接做的视频网站
  • 珠海网站制作定制做设计.不抠图网站
  • seo标签优化方法seo任务平台
  • 国内十大旅游网站排名wordpress 图片云存储
  • 河南网站建设官网网站建设 全包 模板
  • 怎么做服务器网站吗神一般的网页设计
  • 深圳宝安网站建设公司天元建设集团有限公司商票兑付情况
  • 网站排名分析大型网站开发基本流程
  • 网站的子域名怎么设置珠海高端网站建设报价
  • 做网站设计工资多少钱js怎么做网站
  • 官方网站平台下载wordpress好玩
  • 网站备案是需要去哪里做做网站有没有前景
  • 怎么查询网站空间商环保工程 技术支持 东莞网站建设