支持向量机(SVM)算法总结
核心思想
寻找最优划分超平面:最大化边界(margin)
关键概念:支持向量(离超平面最近的样本点)
目标:提高模型泛化能力和鲁棒性
数学原理
超平面方程:wᵀx + b = 0
点到超平面距离:|wᵀx + b|/||w||
优化目标:最大化最小几何间隔
关键特性
硬间隔SVM:完全线性可分情况
软间隔SVM:引入松弛变量处理噪声
核技巧:通过核函数处理非线性问题
支持向量作用
决定超平面位置
仅依赖少量支持向量
影响模型复杂度和泛化能力
优化方法
使用拉格朗日乘子法
转化为对偶问题求解
序列最小优化(SMO)算法
核函数应用
线性核:线性可分问题
多项式核:处理非线性关系
高斯核(RBF):强大非线性处理能力
Sigmoid核:神经网络类似效果
优势特点
有效处理高维数据
小样本学习效果好
理论完备数学基础强
泛化能力优秀
适用场景
文本分类
图像识别
生物信息学
模式识别
实践要点
数据需要标准化处理
核函数选择影响性能
参数调优(C, gamma)很重要
计算复杂度随数据量增大