基于MATLAB的遗传算法优化支持向量机实现
基于MATLAB的遗传算法优化支持向量机实现
一、算法框架设计
二、完整MATLAB代码实现
%% 清空环境
clc; clear; close all;%% 数据加载与预处理(以鸢尾花数据集为例)
load fisheriris
X = meas(:,1:2); % 使用前两个特征
Y = species;% 数据归一化
[X,norm_params] = mapminmax(X',0,1);
X = X';% 划分训练集和测试集
cv = cvpartition(Y,'HoldOut',0.3);
X_train = X(cv.training,:);
Y_train = Y(cv.training);
X_test = X(cv.test,:);
Y_test = Y(cv.test);%% 遗传算法参数设置
options = optimoptions('ga',...'PopulationSize',50,...'MaxGenerations',100,...'CrossoverFcn',@crossoveruniform,...'MutationFcn',@mutationadaptfeasible,...'Display','iter');% 参数范围(惩罚因子C和gamma)
lb = [0.01, 0.0001]; % 下限
ub = [100, 1]; % 上限%% 定义适应度函数(交叉验证准确率)
fitnessFcn = @(params) svmFitness(params, X_train, Y_train);%% 运行遗传算法
[best_params, best_fitness] = ga(fitnessFcn, 2, [], [], [], [], lb, ub, [], options);%% 模型训练与测试
best_C = best_params(1);
best_gamma = best_params(2);% 训练SVM模型
svm_model = fitcsvm(X_train, Y_train,...'KernelFunction','rbf',...'BoxConstraint',best_C,...'KernelScale',1/sqrt(best_gamma));% 预测
Y_pred = predict(svm_model, X_test);%% 性能评估
accuracy = sum(Y_pred == Y_test)/numel(Y_test);
fprintf('测试集准确率: %.2f%%
', accuracy*100);%% 适应度函数定义
function accuracy = svmFitness(params, X, Y)% 参数解码C = params(1);gamma = params(2);% 交叉验证cv = cvpartition(Y,'KFold',5);cv_accuracy = zeros(cv.NumTestSets,1);for i = 1:cv.NumTestSetstrainIdx = cv.training(i);testIdx = cv.test(i);% 训练模型svm_tmp = fitcsvm(X(trainIdx,:), Y(trainIdx),...'KernelFunction','rbf',...'BoxConstraint',C,...'KernelScale',1/sqrt(gamma));% 计算准确率pred = predict(svm_tmp, X(testIdx,:));cv_accuracy(i) = sum(pred == Y(testIdx))/numel(Y(testIdx));endaccuracy = mean(cv_accuracy);
end
三、关键代码解析
- 参数编码策略 采用实数编码,直接优化惩罚因子C和RBF核参数gamma 参数范围设置:C∈[0.01,100],gamma∈
- 适应度函数设计 使用5折交叉验证计算平均分类准确率 避免过拟合:通过交叉验证评估泛化性能
- 遗传算法配置 种群规模:50 最大迭代:100代 交叉操作:均匀交叉(crossoveruniform) 变异操作:自适应可行变异(mutationadaptfeasible)
四、性能优化技巧
-
并行计算加速
options = optimoptions(options, 'UseParallel', true);
-
精英保留策略
options = optimoptions(options, 'EliteCount', 5);
-
自适应参数调整
options = optimoptions(options, 'AdaptFcn', @adaptfeasible);
五、工程应用扩展
-
多分类问题处理
svm_model = fitcecoc(X_train, Y_train,...'Learners', 'svm',...'Coding', 'onevsall',...'OptimizeHyperparameters', 'auto');
-
回归任务改进 修改适应度函数为均方误差(MSE) 使用
fitrsvm
替代fitcsvm
-
动态参数更新
function new_params = dynamic_update(old_params, fitness)% 基于适应度动态调整搜索范围if fitness > 0.95new_params = old_params * 1.1;elsenew_params = old_params * 0.9;end end
六、常见问题解决方案
-
早熟收敛问题 增加变异率(建议范围0.01-0.1) 采用多种群并行策略
-
计算效率优化 使用GPU加速交叉验证过程 限制种群多样性(设置
PopulationRange
) -
参数敏感性分析
% 参数敏感性可视化 figure; hold on; plot(best_params(1), best_params(2),'ro'); xlabel('C'); ylabel('gamma'); title('最优参数分布');
七、完整工具箱支持
-
LibSVM集成
% 需要安装LibSVM工具箱 model = svmtrain(Y_train, X_train, '-c 10 -g 0.1');
-
Deep Learning Toolbox扩展
% 结合深度特征提取 features = alexnet('imagenet'); X_train_feat = activations(features, X_train, 'fc7', 'OutputAs', 'rows');
八、参考文献
- 王克奇等. “采用遗传算法优化最小二乘支持向量机参数的方法.” 计算机应用与软件, 2009.
- 李航. 统计学习方法(第2版). 清华大学出版社, 2019.
- 参考代码 使用遗传算法优化支持向量机源程序 www.youwenfan.com/contentcsi/63695.html
- MathWorks官方文档: Genetic Algorithm Toolbox www.mathworks.com/help/gads/genetic-algorithm.html