当前位置: 首页 > news >正文

支持向量机(SVM)核心概念总结

一、SVM 的基本思想

支持向量机(Support Vector Machine, SVM)是一种经典的监督学习算法,主要用于分类任务。其基本思想是:在样本空间中找到一个划分超平面,将不同类别的样本分开。

二、理想中的超平面

SVM 不仅要求分类正确,还希望找到一个容忍性最好的超平面,即:

对训练样本的局部扰动具有最强的鲁棒性

这意味着超平面应该尽可能远离两类样本点,从而提升模型的泛化能力。、

三、优化目标:最大化间隔(Margin)

SVM 的优化目标是最大化分类间隔(Margin),即两类样本中距离超平面最近的样本点(支持向量)到超平面的距离之和最大。

四、支持向量(Support Vectors)

支持向量是那些距离超平面最近的样本点,它们决定了超平面的位置和方向。换句话说,SVM 的训练结果仅由支持向量决定,与其他样本点无关。

五、超平面的数学表示

超平面是 n 维空间中的一个 𝑛−1维子空间。

例如:三维空间中的超平面是二维平面,二维空间中的超平面是一维直线。

超平面可以用线性方程表示:

其中:
w 是法向量,决定超平面的方向
b 是偏置项,决定超平面的位置

六、点到超平面的距离

点 x 到超平面的距离公式为:d=,该距离是SVM中“间隔”计算的基础。

七、实战演练

导入必要的库:

读取数据:

提取特征和目标变量:

对分类特征进行编码:

 划分训练集和测试集:

数据标准化:

创建 SVM 模型并训练模型:

在测试集上进行预测:

评估模型:

运行结果:

八、总结要点

SVM 的核心是最大化分类间隔,提升模型泛化能力​​

支持向量是决定模型的关键样本

超平面由法向量 w 和偏置 b 定义

    http://www.dtcms.com/a/351972.html

    相关文章:

  • Tensor常见操作
  • vscode使用cmake tool进行项目管理安装
  • Elasticsearch映射:优化搜索性能的关键
  • 【无标题】计数组合学7.21(有界部分大小的平面分拆)
  • JVM模型
  • 微信小程序web-view嵌套H5,小程序与H5通信
  • 不安全的服务器,不支持 FTP over TLS
  • 服务器从0到1微服务所需的环境的安装
  • 数据结构(一):算法的时间复杂度和空间复杂度
  • 双坡阳光房光伏设计,精准实现降本增效
  • 【Python】QT(PySide2、PyQt5):列表数据保存到文件,文件数据加载到列表
  • QT(QTableWidget)
  • Matlab使用——开发上位机APP,通过串口显示来自单片机的电压电流曲线,实现光伏I-V特性监测的设计
  • 盲盒一番赏小程序:打造个性化潮玩购物天堂
  • vs2022 Nuget包缓存下载路径配置
  • 国产机安装caj 国产机没法打开caj文件,国产机如何看论文?
  • AIGC(生成式AI)试用 35 -- AI Agent开发及工作流,LangFlow
  • github拉取OpenSSL SSL_read: Connection was reset, errno 10054
  • Element中table组件(el-table)右侧滚动条空白占位gutter处理
  • window电脑使用OpenSSL创建Ed25519密钥
  • 由倍讯科技研制的CCLinkIE转ModbusTCP网关,可达成与脉冲计数器的连接
  • Tesseract OCR之单词识别与字符分类器
  • Docker:部署Redis
  • 常见flex布局思路:flex布局上下结构
  • 2025中国生物制造科技创新论坛为何“花落”常德?
  • 新源布料厂进销存管理系统-项目分享
  • week5-[字符数组]查找
  • 木马免杀工具使用
  • 智汇云舟:视频孪生技术引领行业变革的场景应用实践
  • 第二十三天-FSMC简介