当前位置：首页 > news >正文

基于SHO与BP神经网络回归模型的特征选择方法研究(Python实现)

news 2025/11/8 15:12:32

说明：这是一个机器学习实战项目（附带数据+代码+文档），如需数据+代码+文档可以直接到文章最后关注获取或者私信获取。

1.项目背景

在在高维数据回归建模中，冗余特征易导致BP神经网络出现过拟合、训练缓慢和预测精度下降等问题。有效的特征选择是提升模型性能的关键环节。斑鬣狗优化算法（Spotted Hyena Optimizer, SHO）作为一种新型群智能算法，具有结构简单、全局搜索能力强和收敛稳定等优点。本文提出一种基于SHO的BP神经网络回归特征选择方法，将特征子集选择转化为优化问题，利用SHO模拟鬣狗群体围猎行为的机制，在高维特征空间中高效搜索最优子集，并以回归模型的预测误差作为适应度评价标准。该方法有效提升BP神经网络的预测精度与泛化能力，降低模型复杂度，为复杂非线性回归任务提供了一种智能、高效的特征选择新途径。

本项目通过基于SHO与BP神经网络回归模型的特征选择方法研究(Python实现)。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成)，数据项统计如下：

编号	变量名称	描述
1	x1
2	x2
3	x3
4	x4
5	x5
6	x6
7	x7
8	x8
9	x9
10	x10
11	y	因变量

数据详情如下(部分展示)：

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据：

关键代码：

3.2数据缺失查看

使用Pandas工具的info()方法查看数据信息：

从上图可以看到，总共有11个变量，数据中无缺失值，共2000条数据。

关键代码：

3.3数据描述性统计

通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。

关键代码如下：

4.探索性数据分析

4.1 y变量分布直方图

用Matplotlib工具的hist()方法绘制直方图：

4.2 相关性分析

从上图中可以看到，数值越大相关性越强，正值是正相关、负值是负相关。

5.特征工程

5.1 建立特征数据和标签数据

关键代码如下：

5.2 数据集拆分

通过train_test_split()方法按照80%训练集、20%测试集进行划分，关键代码如下：

6.构建特征选择模型

主要使用通过基于SHO与BP神经网络回归模型的特征选择方法研究(Python实现)。

6.1 寻找最优特征

最优特征：

6.2 最优特征构建模型

编号	模型名称	参数
1	BP神经网络回归模型	units=64
2		optimizer=opt
3		epochs=50

6.3 模型摘要信息

6.4 模型训练集测试集损失曲线图

7.模型评估

7.1评估指标及结果

评估指标主要包括R方、均方误差、解释性方差、绝对误差等等。

模型名称	指标名称	指标值
测试集
BP神经网络回归模型	R方	0.8402
	均方误差	7119.6019
	解释方差分	0.8419
	绝对误差	68.1994