当前位置: 首页 > news >正文

机器学习概述

机器学习组成:数据、模型(机器学习算法:逻辑回归、最大熵模型、k-近邻、决策树、朴素贝叶斯、支持向量机、降维、聚类、深度学习)、性能度量准则

数据:通常需要进行预处理

模型:从机器学习模型中选择一个来对数据建模

性能度量准则:用于指导机器学习模型进行模型参数的求解,参数求解也就是训练。训练模型需要对大量参数进行反复的调整也叫做调参。在训练之前就已经设置好的参数就是超参数。

根据预测数据输出的连续性分为(分类、回归)。分类问题以离散随机变量或者离散随机变量概率分布作为输出,回归问题以连续输出作为预测输出。

在某些情况回归分类问题可以相互转换。比如估计人的年龄问题,可以把年龄估计问题看作0-100的回归,也可以量化为101个年龄类别的分类。

监督学习:样本包含标签的机器学习,将标签作为监督信息最小化损失函数,通过梯度下降或拟牛顿进行参数的调整

无监督学习:从没有标注的数据中挖掘信息,比如:降维、聚类。比如:根据用户特征然后对用户进行归类,实现精准推送

半监督学习:有部分数据有标签

根据机器学习模型是否可用于生成新的数据,分为生成模型、判别模型。

生成模型:从训练集中学习输入和输出的联合概率分布,对于新给定的样本,计算X与不同标记之间的联合概率分布,最大概率作为预测值。

判别模型:一个条件概率分布,及后验概率分布。

过拟合:在训练集效果好,测试集效果差

欠拟合:训练集、测试集效果都差

正则化:正则化一般作为损失函数的一部分被加入到原来的基于数据的损失函数中。

http://www.dtcms.com/a/318321.html

相关文章:

  • 微调训练时,ignore_empty_think是怎么保护模型的思考能力?
  • 自然语言处理的相关概念与问题
  • Redis面试精讲 Day 12:Redis Sentinel哨兵机制详解
  • 非机动车识别mAP↑28%!陌讯多模态融合算法在智慧交通的实战解析
  • PyTorch生成式人工智能——Hugging Face环境配置与应用详解
  • leetcode 3479. 水果成篮 III 中等
  • 74.5%登顶SWE-bench:Claude Opus 4.1如何重塑AI编程格局
  • AdGuard 安卓修改版:全方位广告拦截与隐私保护专家
  • 将英文PDF文件完整地翻译成中文的4类方式
  • 【机器学习篇】02day.python机器学习篇Scikit-learn基础操作
  • Kafka ISR机制和Raft区别:副本数优化的秘密
  • 浅谈对linux进程池的理解
  • 解决远程连接云服务器mysql编号1130问题
  • Vue Router 路由的创建和基本使用(超详细)
  • 《算法导论》第 7 章 - 快速排序
  • 服务器工作职责及核心组件详解
  • P1629 邮递员送信
  • 【RabbitMQ】高级特性—发送方确认详解
  • 【科研绘图系列】R语言绘制瀑布图
  • 院校机试刷题第二十一天|回顾代码随想录第十六天、
  • google官方性能文档:Android 动态性能框架优化散热和 CPU 性能-Thermal API部分
  • 短剧小程序系统开发:技术驱动下的内容创新之路
  • 2025年08月 GitHub 热门项目推荐
  • 1深度学习Pytorch-pytorch、tensor的创建、属性、设备和类型转换、数据转换、常见操作(获取元素、元素运算、形状改变、相乘、广播)
  • 【31】C++实战篇——C++ 从数组里找出相邻两个波谷之间的主波峰的y值和其对应下标i,考虑到波形的上升和下降情况
  • 【AI总结】python连接MySQL(5)- 高级数据库配置与连接器设计
  • go语言变量2
  • 开疆智能ModbusTCP转Profinet网关连接安川YRC1000机器人配置案例
  • 嵌入式处理器指令系统:精简指令集RISC与复杂指令集CISC的简介,及区别
  • Cervantes:面向渗透测试人员和红队的开源协作平台