当前位置: 首页 > news >正文

python学智能算法(三十六)|SVM-拉格朗日函数求解(中)-软边界

【1】引言

前序学习进程中,已经对常规SVM拉格朗日方程求解展开了探索。
但面对软边界SVM拉格朗日方程,对求解提出了新的要求。

【2】方程求解

软边界拉格朗日方程表达式为:
L(w,b,ξ,α,μ)=12∣∣w∣∣2+C∑i=1nξi−∑i=1nαi[yi(w⋅xi+b)−1+ξi]−∑i=1nμiξiL(w,b,\xi,\alpha,\mu)=\frac{1}{2}||w||^2+C\sum_{i=1}^{n}{\xi_{i}}-\sum_{i=1}^{n}\alpha_{i}[y_{i}(w\cdot x_{i}+b)-1+\xi_{i}]-\sum_{i=1}^{n}\mu_{i}\xi_{i}L(w,b,ξ,α,μ)=21∣∣w2+Ci=1nξii=1nαi[yi(wxi+b)1+ξi]i=1nμiξi

【2.1】对www求偏导数

L对wL对wLw的偏导数为0:
∂L∂w=w−∑i=1nαiyixi=0\frac{\partial L}{\partial w}=w-\sum_{i=1}^{n}\alpha_{i}y_{i}x_{i}=0wL=wi=1nαiyixi=0
获得:
w=∑i=1nαiyixiw=\sum_{i=1}^{n}\alpha_{i}y_{i}x_{i}w=i=1nαiyixi
可见,超平面的法向量www可以由样本xix_{i}xi,标签yiy_{i}yi和乘子αi\alpha_{i}αi线性表示。

【2.2】对bbb求偏导数

L对bL对bLb的偏导数为0:
∂L∂b=−∑i=1nαiyi=0\frac{\partial L}{\partial b}=-\sum_{i=1}^{n}\alpha_{i}y_{i}=0bL=i=1nαiyi=0
获得:
∑i=1nαiyi=0\sum_{i=1}^{n}\alpha_{i}y_{i}=0i=1nαiyi=0
可见,标签yiy_{i}yi和乘子αi\alpha_{i}αi的加权和为0。

【2.3】对ξi\xi_{i}ξi求偏导数

L对ξiL对\xi_{i}Lξi的偏导数为0:
∂L∂ξi=C−αi−μi=0\frac{\partial L}{\partial \xi_{i}}=C-\alpha_{i}-\mu_{i}=0ξiL=Cαiμi=0
获得:
μi=C−αi\mu_{i}=C-\alpha_{i}μi=Cαi
可见,乘子μi\mu_{i}μi可以由CCCαi\alpha_{i}αi表示,因为前序已经规定μi≥0\mu_{i}\geq0μi0αi≥0\alpha_{i}\geq0αi0,所以有:
0≤αi≤C0\leq\alpha_{i}\leq C0αiC

【2.4】将偏导数结果代入原方程

首先是www项:
12∣∣w∣∣2=12(∑i=1nαiyixi)(∑j=1nαjyjxj)=12∑i,j=1nαiαjyiyj(xi⋅xj)\frac{1}{2}||w||^2=\frac{1}{2}(\sum_{i=1}^{n}{\alpha_{i}y_{i}x_{i}})(\sum_{j=1}^{n}{\alpha_{j}y_{j}x_{j}})\\= \frac{1}{2}\sum_{i,j=1}^{n}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})21∣∣w2=21(i=1nαiyixi)(j=1nαjyjxj)=21i,j=1nαiαjyiyj(xixj)
然后是ξi\xi_{i}ξi项:
C∑ξi−∑αiξi−∑μiξi=C∑ξi−∑αiξi−∑(C−αi)ξi=0C\sum{\xi_{i}}-\sum\alpha_{i}\xi_{i}-\sum\mu_{i}\xi_{i}\\=C\sum{\xi_{i}}-\sum\alpha_{i}\xi_{i}-\sum(C-\alpha_{i})\xi_{i} \\=0Cξiαiξiμiξi=Cξiαiξi(Cαi)ξi=0
整理后获得的方程为:
L(w,b,ξ,α,μ)=∑αi−12∑i,j=1nαiαjyiyj(xi⋅xj)L(w,b,\xi,\alpha,\mu)=\sum{\alpha_{i}}-\frac{1}{2}\sum_{i,j=1}^{n}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i}\cdot x_{j})L(w,b,ξ,α,μ)=αi21i,j=1nαiαjyiyj(xixj)

【3】总结

学习了SVM软边界拉格朗日方程求解的基本方法。

http://www.dtcms.com/a/322372.html

相关文章:

  • docker的开源跨平台替代Vagrant
  • Zread:把 GitHub 仓库“一键变说明书”的体验与实战指南
  • 【超强总结】图像分割模型训练核心:优化器选型与学习率调控策略
  • 【数据结构初阶】--文件归并排序
  • 前端懒加载技术全面解析
  • Spring学习笔记:Spring AOP入门以及基于Spring AOP配置的深入学习与使用
  • Vue3的简单学习
  • docker基础前置
  • day18 - CSS函数
  • ADB(Android Debug Bridge)—— Android调试桥
  • Android MediaMetadataRetriever取视频封面,Kotlin(1)
  • 【Android调用相册、拍照、录像】等功能的封装
  • Milvus 向量数据库基础操作解析
  • 进阶向:Python编写网页爬虫抓取数据
  • vulnhub-Beelzebub靶场通关攻略
  • 【Spring Boot 快速入门】八、登录认证(二)统一拦截
  • Android中RecyclerView基本使用
  • 鸿蒙分布式任务调度深度剖析:跨设备并行计算的最佳实践
  • Java安全-组件安全
  • 哈希与安全
  • Red Hat Enterprise Linux 7.9安装Oracle 11.2.0.4单实例数据库-图文详解
  • urmom damn the jvm
  • vscode/trae 的 settings.json 中配置 latex 的一些记录
  • QT环境搭建
  • 数学学习 | 高数、线代、概率论及数理统计荐书
  • 【Task2】【Datawhale AI夏令营】多模态RAG
  • 图片拆分工具,自定义宫格切割
  • 第4章 程序段的反复执行4.2while语句P128练习题(题及答案)
  • CVPR中深度学习新范式:通用性、鲁棒性与多模态的创新突破
  • 六、CV_图像增强方法