当前位置: 首页 > news >正文

Day16_【机器学习建模流程】

一、机器学习建模流程:

  1. 获取数据(搜集与完成机器学习任务相关的数据集)
  2. 数据基本处理(数据 缺失值处理,异常值处理)
  3. 特征工程(特征提取、特征预处理 、特征降维、特征选择 、特征组合)
  4. 机器学习 (模型训练)选择合适的算法对模型进行训练(有监督学习,无监督学习,半监督学习,强化学习)
  5. 模型评估(回归评测指标 、线性评测指标 、聚类评估指标)评估效果好上线服务,评估效果不好则重复上述步骤

二、特征工程

特征:对任务有用的信息

特征工程:利用背景知识和专业技巧处理数据,让模型效果更好

  • 特征提取 —— 专家面向原始数据的提取
  • 特征预处理 —— 归一化和标准化 解决量纲问题
  • 特征降维 —— 维度退化:3个特征 变成两个
  • 特征选择(很少做,不然说明特征提取有问题)—— 从特征提取中选择出一些重要特征训练模型
  • 特征组合 —— 把多个特征合并组合成一个特征
http://www.dtcms.com/a/355192.html

相关文章:

  • Python备份实战专栏第2/6篇:30分钟搭建企业级API认证系统,安全性吊打90%的方案
  • R语言贝叶斯方法在生态环境领域中的高阶技术应用
  • Mac 开发环境与配置操作速查表
  • 基于Vue2+elementUi实现树形 横向 合并 table不规则表格
  • 华为S5720S重置密码
  • 前沿技术观察:从AI 时代到量子计算的下一站
  • 智能物联网(AIoT)核心技术落地路径与企业数字化转型适配方案
  • 如何通俗的理解操作系统的IO多路复用
  • H5 本地跨域设置
  • “帕萨特B5钳盘式制动器结构设计三维PROE模型7张CAD图纸PDF图“
  • UE5.5模型导入FBX强制x轴向前Force Front XAxis
  • 上线问题——Mac系统下如何获取鸿蒙APP证书公钥和MD5指纹
  • 密码管理中
  • 多线程 【详解】| Java 学习日志 | 第 14 天
  • Ansys Icepak AEDT 中的后处理脚本
  • 护网面经总结(三)
  • 三维细节呈现核心技术:法线、凹凸与置换贴图全解析与应用指南
  • 物业满意度调查数据分析——从 “数据杂乱” 到 “精准改进” 的落地经验(满意度调查问卷)
  • Linux系统资源分配算法在VPS云服务器调优-性能优化全指南
  • ​突破RAG知识库中的PDF解析瓶颈:从文本错乱到多模态处理的架构跃迁​
  • 【C++成长之旅】C++入门基础:从 Hello World 到命名空间与函数重载的系统学习
  • NV002NV003美光固态闪存NV026NV030
  • 数组替代map实现性能优化
  • Multimodal Transformer Training in Personalized Federated Learning
  • 配送算法17 AFramework for Multi-stage Bonus Allocation in meal delivery Platform
  • 替换数字(字符串算法)
  • 宋红康 JVM 笔记 Day08|堆
  • SMTPman,smtp协议是什么协议的核心功能!
  • 大数据毕业设计选题推荐-基于大数据的存量房网上签约月统计信息可视化分析系统-Hadoop-Spark-数据可视化-BigData
  • MySQL 8.0 事务深度解析:从核心特性到实战应用