当前位置: 首页 > news >正文

机器学习的工作流程

🌟 欢迎来到AI奇妙世界! 🌟

亲爱的开发者朋友们,大家好!👋

我是人工智能领域的探索者与分享者,很高兴在CSDN与你们相遇!🎉 在这里,我将持续输出AI前沿技术、实战案例、算法解析等内容,希望能和大家一起学习、交流、成长!💡

🔥 为什么关注AI?

人工智能正在重塑世界!🌍

🚀 深度学习让机器拥有“视觉”“听觉”
🤖 **大模型(如GPT、文心一言)**改变人机交互方式
📊 数据科学赋能商业决策
🏥 AI医疗助力精准诊断
🛒 智能推荐优化用户体验
无论你是AI新手👶,还是资深极客👨💻,这里都有适合你的内容!

📌 你将在这里看到什么?

✅ AI基础入门(Python、TensorFlow/PyTorch)
✅ 实战项目(图像识别、NLP、推荐系统)
✅ 论文解读(CVPR、NeurIPS最新研究)
✅ 行业动态(AI政策、大模型进展)
✅ 避坑指南(训练技巧、调参经验)

💬 期待与你互动!

📢 评论区随时交流,欢迎提问!
💌 私信开放,一起探讨技术难题!
🤝 关注我,AI学习路上不迷路!

最后,送上一句AI圈的经典名言:

“人工智能不会取代人类,但会用AI的人会取代不用AI的人。”

让我们一起拥抱AI时代,用代码改变未来!🚀

点击关注👉,开启AI之旅! 🔥🔥🔥

目录

一.什么是机器学习

二.机器学习的工作流程

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

②数据中的名词

③数据类型的构成

④数据分割

2.数据基本处理

3.特征工程

①什么是特征工程?

②为什么需要特征工程?

③特征工程包含的内容(了解)

特征提取

特征预处理

特征降维

4.机器学习(模型训练)

5.模型评估

小结


一.什么是机器学习

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

 简单来说,计算机通过对新的数据进行分析,获得一个模型,通过这个模型,计算机就可以预测未知属性

二.机器学习的工作流程

机器学习工作流程总结: 

  1. 获取数据
  2. 数据基本处理
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估:①结果达到要求,则上线服务 / ②结果没达到要求,则重复上面的步骤

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

  • 房屋价格:可能是小数,如105.5万

  • 电影数据:动作片/喜剧片等等

  • 人物分类:可以按是否戴帽子 / 手里是否拿东西等等,来进行分类,没有对错之分,只是分类角度不同

②数据中的名词

在数据集中一般:

  • 一行数据我们称为一个样本

  • 一列数据我们称为一个特征

  • 需要我们判断的列(如上图的电影类型),我们称为目标值
  • 有些数据有目标值,有些数据没有目标值

如下图,有的行就没有电影类型,有的就有。

③数据类型的构成

  • 数据类型一:特征值+目标值(目标值是连续的和离散的)
  • 数据类型二:只有特征值,没有目标值

④数据分割

  • 机器学习一般的数据集会分成两部分
    • 训练数据:用于训练,构建模型
    • 测试数据:在模型检验时使用,用于评估模型是否有效
  • 划分比例:
    • 训练集:70% ~ 80%
    • 测试集:30% ~ 20%

2.数据基本处理

        对数据进行缺失值、去除异常值等处理。

        举例:比如我们让一群人填写问卷调查,肯定有人会有部分项不填写(缺失值),或者年龄填写1000岁(异常值),这两种情况就需要进行处理。

3.特征工程

①什么是特征工程?

        特征工程是使用专业背景知识和技巧,对数据进行处理,使得特征能在机器学习算法上发挥更好的作用

        意义:会直接影响机器学习的效果。

        简单理解就是,进一步对数据进行处理。

        因为工程一般都很重要(比如盖楼工程),所以就表示提取数据的特征是一件很重要的事,因此叫做特征工程。

②为什么需要特征工程?

③特征工程包含的内容(了解)

  • 特征提取

将任意数据(如文本或图像),转换为可用于机器学习的数字特征。

  • 特征预处理

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

  • 特征降维

指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程。

4.机器学习(模型训练)

单独讲,请见该合集中的【机器学习算法分类介绍】文章。

5.模型评估

单独讲,请见该合集中的【模型评估】文章。

小结

以上就是本篇文章的全部内容,喜欢的话可以留个免费的关注呦~~~

 

http://www.dtcms.com/a/299268.html

相关文章:

  • JVM-GC 相关知识
  • 配置DNS正反向解析
  • 深度学习(鱼书)day03--神经网络(后两节)
  • 【教程】无需迁移IDE!Augment原生插件实现Cursor无缝平替 Claude-4无限用
  • ClickHouse高性能实时分析数据库-消费实时数据流(消费kafka)
  • Flutter开发实战之路由与导航
  • Redis面试精讲 Day 5:Redis内存管理与过期策略
  • HTTP 协议的基本格式和 fiddler 的用法
  • 15.6 DeepSpeed+Transformers实战:LLaMA-7B训练效率提升210%,显存直降73%
  • Spring Boot 项目启动自动执行逻辑的最佳实践:掌握 CommandLineRunner
  • Windows11下和Vmware中的Ubuntu22.04设置samba服务遇到的一个问题- valid users和guest设置冲突
  • 【架构师从入门到进阶】第五章:DNSCDN网关优化思路——第十节:网关安全-单向加密
  • k8s之控制器详解
  • 什么是Paimon?Paimon是什么?
  • 兼容性问题记录
  • 速通python加密之RSA加密
  • 刷题日记0726
  • AI使能的SVD算子:基于深度学习的矩阵分解方法
  • 个人电脑配置IPv6的详细步骤
  • 【线段树】P8473 [Aya Round 1 H] 破碎的历史|普及+
  • TypeScript compilerOptions 深入全面讲解
  • 20250726-4-Kubernetes 网络-Service DNS名称解析_笔记
  • OCR工具集下载与保姆级安装教程!!
  • DSP在CCS中实现双核在线仿真调试及下载的方法(以TMS320F28x为例)
  • iOS 26,双版本更新来了
  • MyBatis_3
  • 【iOS】网易云仿写
  • 全文检索官网示例
  • 算法竞赛阶段二-数据结构(35)数据结构单链表模拟实现
  • springboot + vue3 拉取海康视频点位及播放