当前位置: 首页 > news >正文

机器学习sklearn:决策树的参数、属性、接口

决策树有八个参数:Criterion,两个随机性相关的参数(random_state,splitter),五个剪枝参数(max_depth, min_samples_split,min_samples_leaf,max_feature,min_impurity_decrease)
一个属性:feature_importances_
四个接口:fit,score,apply,predict

样例:

import numpy as np
import pandas as pd
from PIL.ImageColor import colormap
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_wine
from sklearn import treewine = load_wine()Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data, wine.target, test_size=0.3)clf = tree.DecisionTreeClassifier(criterion='entropy', random_state=30, splitter='random', min_samples_split=10, min_samples_leaf=10, max_depth=10)clf = clf.fit(Xtrain, Ytrain)
clf.feature_importances_
clf.apply(Xtest)
clf.predict(Xtest)

一、参数

1、criterion

        参数默认gini,还有entropy,想要高拟合就用entropy

2、random_state       

        设置数字就是固定随机选择的种子,每次运行都一样

3、splitter

        默认是“best”,高拟合

        担心拟合高了或特征太多就用“random”

4、max_depth

        树生长的最大深度,通常是限制拟合过高的情况

5、min_samples_split,min_samples_leaf

        要到min_samples_split个样本才会考虑继续分裂,分裂后的子节点不能少于min_samples_leaf

6、max_features

        特征个数

二、属性

1、feature_importances_

        显示每个特征的重要性

        

三、接口

1、fit

        训练

2、score

        正确率

3、predict

        预测结果是哪一组

4、apply

        叶子节点的索引

http://www.dtcms.com/a/303186.html

相关文章:

  • redis getshell得方式
  • Redis 部署模式详解
  • stm32开发 -- TFTLCD相关
  • Zabbix 6.0 监控AWS全栈实战|EC2至Lambda的无缝监控
  • 配置 MCP 让 cursor 结合 Figma 自动生成设计稿组件
  • Python defaultdict 的强大之处:告别繁琐的字典键检查: Effective Python 第17条
  • Python动态规划:从基础到高阶优化的全面指南
  • 网络与信息安全有哪些岗位:(3)安全运维工程师
  • 微算法科技(NASDAQ:MLGO)利用基于区块链的机器学习模型进行交易分类,实现交易数据的匿名化
  • Linux内核驱动开发核心问题全解
  • shell每日三题大神之路:第三天
  • Java 笔记 transient 用法
  • 四、计算机组成原理——第4章:指令系统
  • EAP(基于事件的异步编程模式)
  • 计算机网络编程-Socket通信以及实战
  • Ettus USRP X410/X440 运行 ADC 自校准
  • Yolo底层原理学习--(第二篇)
  • STM32-基本定时器
  • 【动态规划 | 路径问题】动态规划方法:解决路径问题的最佳策略
  • ESP32-S3学习笔记<8>:LEDC的应用
  • 【历史人物】【韩愈】简历与生平
  • Springboot 项目中使用 Filter 全指南
  • 基于Python的arXiv论文数据分析系统:从爬取到可视化的完整实践
  • flexbuild-imx91 imx93
  • Java-分布式锁
  • Lakehouse: Unifying DW Advanced Analytics in Open Platforms
  • 【C语言网络编程基础】TCP并发网络编程:io多路复用
  • 开源赋能产业,生态共筑未来 | 开源科学计算与系统建模(openSCS)分论坛圆满举行
  • 笔试——Day21
  • JS面试题