当前位置: 首页 > news >正文

机器学习——模型架构

有监督学习

线性模型

多元线性回归:预测连续的数值(如房价、销量)。

逻辑回归:解决二分类问题(如判断邮件是否是垃圾邮件),输出概率。

非线性模型

决策树:通过一系列if-then规则进行决策,非常直观易懂。
用途:分类和回归。

随机森林:集成学习方法。通过构建多棵决策树并综合它们的結果(如投票或平均),极大地提升了模型的准确性和鲁棒性,不易过拟合。
用途:几乎可用于任何问题,是非常强大的基准模型。

梯度提升机:另一种集成学习方法,如 XGBoost, LightGBM, CatBoost。通过迭代地训练新树来修正前一轮树的错误,性能通常比随机森林更优,是许多数据科学竞赛的“大杀器”。
用途:处理结构化/表格数据的最佳选择之一。

支持向量机

传统图像处理中最好用的算法,目前不用了。

SVM:寻找一个“最大间隔”的超平面来区分不同类别的数据。对于非线性问题,可以使用“核技巧”映射到高维空间进行分离。
用途:尤其在中小规模数据集上表现优异,适用于高维数据(如文本、图像)。

神经网络与深度学习

神经网络:由大量神经元连接构成的模型,可以拟合极其复杂的非线性关系。

深度学习:特指层次更深的神经网络。

多层感知机:最基础的前馈神经网络,可用于表格数据的分类和回归。

卷积神经网络:专门为处理网格状数据(如图像)设计,是计算机视觉领域的核心。

循环神经网络:专门为处理序列数据(如文本、时间序列、语音)设计。

Transformer:目前自然语言处理领域的绝对主力模型(如BERT, GPT系列),在计算机视觉等领域也表现优异。

其他经典模型

朴素贝叶斯:基于贝叶斯定理,假设特征之间相互独立。虽然“朴素”,但在文本分类等领域非常高效。

K近邻:一种“懒学习”算法,通过查找最接近的K个已知样本的标签来预测新样本。简单但计算开销大。

无监督学习

无监督学习的数据没有标签。模型的任务是发现数据内在的结构和模式。

聚类算法

K-Means:将数据分成K个簇,使得同一簇内的数据点尽可能相似。
用途:客户分群、图像压缩、异常检测。

DBSCAN:基于密度的聚类算法,能发现任意形状的簇,并能识别出噪声点。

层次聚类:通过构建树状的簇结构来形成数据集的层次分组。

降维算法

主成分分析:将高维数据投影到低维空间,尽可能保留原始数据的方差。常用于数据可视化和特征预处理。

t-SNE, UMAP:更现代的非线性降维技术,特别擅长将高维数据可视化到2维或3维空间,能保留复杂的局部结构。

关联规则学习

Apriori:用于从大规模数据中发现物品之间的关联规则。
用途:“购物篮分析”(经典的“啤酒和尿布”故事)。

异常检测

隔离森林:专门用于异常检测的算法,通过随机分割来隔离异常点,效率很高。

自编码器:一种神经网络,通过将输入压缩再重建来学习数据的核心特征。重建误差大的点可以被视为异常。

半监督学习

半监督学习:处理只有少量数据有标签,大部分数据无标签的情况。它结合了监督和无监督学习的方法。

强化学习

强化学习:模型(智能体)通过与环境交互,根据获得的奖励或惩罚来学习最佳策略。
用途:AlphaGo、机器人控制、自动驾驶、游戏AI。

模型选择

问题类型

预测数值? -> 回归问题(线性回归、随机森林回归、梯度提升回归)。

预测类别? -> 分类问题(逻辑回归、SVM、随机森林、神经网络)。

发现分组? -> 聚类(K-Means, DBSCAN)。

发现异常? -> 异常检测(隔离森林)。

降低维度? -> 降维(PCA, t-SNE)。

数据规模和特征

样本少、特征少:从简单模型开始,如SVM、逻辑回归。

样本多、特征多(表格数据):树模型(随机森林、XGBoost)通常是首选。

图像、文本、语音数据:深度学习(CNN, RNN, Transformer)几乎是不二之选。

对可解释性的要求

需要解释模型为什么这样预测:决策树、逻辑回归、线性模型。

追求极致精度,可解释性不重要:深度学习、复杂的集成模型。

http://www.dtcms.com/a/361270.html

相关文章:

  • ✝常用表格✝
  • 读《独角兽项目:数字化转型》
  • 【开题答辩全过程】以 基于微信小程序的校园二手物品交易平台的设计与实现为例,包含答辩的问题和答案
  • 分布式光伏模式怎么选?从 “凭经验” 到 “靠数据”,iSolarBP 帮你锁定最优解
  • 苹果WWDC25开发秘鉴:AI、空间计算与Swift 6的融合之道
  • 领码方案:低代码平台前端缓存与 IndexedDB 智能组件深度实战
  • GDAL 简介
  • FAST API部署和使用
  • java讲解自己对业务架构、数据架构、应用架构的理解
  • gh-pages部署github page项目
  • 【机器学习入门】5.1 线性回归基本形式——从“选西瓜”看懂线性模型的核心逻辑
  • A2A + MCP 的python实现的最小可运行骨架
  • duilib中CTextUI控件使用技巧与问题总结(CTextUI控件自适应文字宽度特性)
  • 五、练习2:Git分支操作
  • 四、操作系统
  • 腾讯混元翻译大模型Hunyuan-MT-7B:重塑跨语言沟通的技术革命
  • 2025年应届生求职加分指南:这些新兴技能路径让你脱颖而出
  • 电子电气架构 --- 智能电动车EEA电子电气架构(下)
  • 【LeetCode 热题 100】5. 最长回文子串——中心扩散法
  • Linux按键输入实验
  • (纯新手教学)计算机视觉(opencv)实战十一——轮廓近似(cv2.approxPolyDP)
  • Python OpenCV图像处理与深度学习:Python OpenCV特征检测入门
  • “人工智能+”时代的端侧AI:算力下沉与实时视频的新基座
  • crypto-whatkey(2025YC行业赛)
  • 【OpenFeign】基础使用
  • 移动端签名组件横屏实现
  • LeetCode199. 二叉树的右视图 - 解题思路与实现
  • [系统架构设计师]案例(二十四)
  • 纯代码实现登录页面的DIY
  • 蓝牙BLE modem调制里面phase manipulation什么意思