当前位置：首页 > news >正文

RDEx：一种效果驱动的混合单目标优化器，自适应选择与融合多种算子与策略

news 2025/10/19 9:19:22

RDEx: An effectiveness-driven hybrid Single-Objective optimizer that adaptively selects and combines multiple operators and strategies

摘要（Abstract）

差分进化（DE）算法在连续优化问题上表现出了卓越的性能。在DE的基础上，先进的变体算法在黑盒、边界约束问题上取得了显著更优的结果。然而，对于现实世界中多样化的问题，单一的算子或策略很少能够完全胜任；因此，混合算法在实践中通常能提供更好的效果和通用性。在这项工作中，我们通过融合先前DE变体中几种最具特色的策略来改进LSRTDE，以解决DE常见的弱点——探索能力有限、种群多样性丧失以及后期停滞。在CEC 2025单目标边界约束基准测试集上的评估表明，我们的扩展方法RDEx取得了迄今为止最先进的性能。

I 引言（ INTRODUCTION）

差分进化（Differential Evolution, DE）由 Storn 和 Price [1] 提出，因其简洁性和强大的探索能力，已成为连续全局优化领域的基石算法。DE已成功应用于工程设计、生物信息学、机器人学和神经架构搜索等多个领域。

尽管DE通常有效，但经典DE算法在保持探索与开发之间平衡方面面临挑战，尤其是在高维、多峰和约束优化问题中。在过去的二十年中，研究人员提出了众多DE变体以改进收敛速度、鲁棒性和自适应性。

SHADE[2] 引入了一种历史记忆机制来动态调整缩放因子 $F$ 和交叉率 $CR$ 。L-SHADE[3] 通过实施线性种群规模缩减（LPSR）进一步扩展了该方法，使其在收敛后期阶段更加有效。JADE[4] 增加了基于存档的当前到p最佳（current-to-pbest）策略，在保持多样性的同时增强了局部开发能力。ILSHADE-RSP[5] 和 EBLSHADE[6] 则分别：（i）在交叉阶段向目标向量注入柯西分布扰动，以及（ii）引入了一种排名引导的差分算子，将搜索导向当前更优的解。最后，L-SRTDE[7] 作为CEC 2024的获胜算法，将LPSR与基于成功率的自适应学习相结合，实现了性能与稳定性的显著平衡。

尽管有这些创新，许多先进的DE变体仍受困于增加的算法复杂度，它们引入了多个控制参数或依赖于需要仔细调整的策略池。此外，由于缺乏自发的多样性恢复机制，它们在面对欺骗性景观或约束可行域时，常常表现不佳。

为解决这些局限性，我们提出了 RDEx，一种参数少、自适应的DE变体，它引入了两个关键创新：

精英排序变异： 在收敛后期，RDEx将变异偏向种群中的精英个体，从而增强开发强度，在不牺牲稳定性的前提下加速收敛。
维度柯西扰动： 在交叉过程中，试验解的每个维度都可能基于柯西分布经历一个罕见的、重尾的扰动，这能有效重新引入多样性，并允许算法逃离局部极小值。

我们在CEC 2025基准测试集上对RDEx进行了评估，该测试集包含29个从单峰到混合及复合类型的实参数函数。RDEx成功将29个函数求解至既定精度阈值，其表现优于L-SHADE和L-SRTDE等竞争算法。该算法在不同维度问题上均展现出更优的收敛速度和鲁棒性。

II 方法（METHOD）

A. 种群初始化（Population Initialization）

设 $D$ 表示问题的维度， $N$ 表示种群规模。每个个体 $xi,0\mathbf{x}_{i,0}$ 在预定义的边界 $l_{j},u_{j}]$ 内随机初始化：

$xi,j,0∼U(lj,uj),i=1,...,N;j=1,...,D(1)x_{i,j,0}\sim\mathcal{U}(l_{j},u_{j}),\quad i=1,...,N;\ j=1,...,D \tag{1}$

B. 变异与交叉（Mutation and Crossover）

在初始阶段，RDEx 采用 DE/rand/1 变异策略：

$vi,g=xr1,g+F⋅(xr2,g−xr3,g)(2)\mathbf{v}_{i,g}=\mathbf{x}_{r_{1},g}+F\cdot(\mathbf{x}_{r_{2},g}-\mathbf{x}_{r_{3},g}) \tag{2}$

一旦收敛速度放缓，则采用基于精英的变异策略：

$vi,g=xi,g+F⋅(xbest,g−xi,g)+F⋅(xr1,g−xr2,g)(3)\mathbf{v}_{i,g}=\mathbf{x}_{i,g}+F\cdot(\mathbf{x}_{best,g}-\mathbf{x}_{i,g})+F\cdot(\mathbf{x}_{r_{1},g}-\mathbf{x}_{r_{2},g})\tag{3}$

其中 $xbest,g\mathbf{x}_{best,g}$ 是排名最高的解。

交叉操作使用二项式逻辑按维度执行：

$j=jrandxi,j,g,otherwise(4)u^{\prime}_{i,j,g}=\begin{cases}v_{i,j,g},&\text{if }rand()<CR\text{ or }j=j_{rand}\\ x_{i,j,g},&\text{otherwise}\end{cases} \tag{4}$

C. 柯西引导扰动（Cauchy-Guided Perturbation）

为防止停滞，以概率 $p$ 独立地对每个维度施加一个罕见扰动：

$ui,j,g=ui,j,g′+δj,δj∼Cauchy(0,γ)(5)u_{i,j,g}=u^{\prime}_{i,j,g}+\delta_{j},\quad \delta_{j}\sim\text{Cauchy}(0,\gamma) \tag{5}$

D. 选择与替换（Selection and Replacement）

采用标准 DE 选择策略：

$f(ui,g)≤f(xi,g)xi,g,otherwise(6)\mathbf{x}_{i,g+1}=\begin{cases}\mathbf{u}_{i,g},&\text{if }f(\mathbf{u}_{i,g}) \leq f(\mathbf{x}_{i,g})\\ \mathbf{x}_{i,g},&\text{otherwise}\end{cases}\tag{6}$

E. 混合率更新（Hybrid Rate Update）

精英引导变异率 $βg\beta_{g}$ 动态计算如下：

$βg=∑elite(fold−fnew)∑all(fold−fnew)+ϵ(7)\beta_{g}=\frac{\sum_{elite}(f_{old}-f_{new})}{\sum_{all}(f_{old}-f_{new})+\epsilon}\tag{7}$

其中 $ϵ\epsilon$ 是一个防止除零的小常数。

III. 伪代码（PSEUDOCODE）

算法: RDEx - 基于能量平衡混合策略的差分进化算法输入: 目标函数 f(x)变量维度 D最大评估次数 MaxFEs种群大小 NP边界约束 [Left, Right]输出:最优解 x_best最优值 f_best初始化:// 随机数生成器初始化初始化多个随机数生成器和分布函数// 参数设置MemorySize = 5EB_hybrid_rate_init = 0.7SuccessRate = 0.5// 种群初始化创建种群 Popul[NP][D]，随机填充在[Left, Right]范围内创建前沿种群 PopulFront[NP][D]初始化适应度数组 FitArr[NP] 和 FitArrFront[NP]初始化记忆库 MemoryCr[MemorySize] = 1.0, MemoryF[MemorySize] = 1.0初始化 EB_hybrid_flag[NP]// 评估初始种群对每个个体 i:FitArr[i] = f(Popul[i])更新全局最优解根据适应度排序，填充前沿种群 PopulFront主循环 (当 NFEval < MaxFEs):// 参数自适应meanF = 0.4 + tanh(SuccessRate*5)*0.25sigmaF = 0.02// 生成选择分布根据指数分布生成 ComponentSelectorFront根据线性分布生成 ComponentSelectorFront2 和 ComponentSelectorFront3// 变异和交叉操作对每个个体 TheChosenOne:随机选择三个不同个体 prand, Rand1, Rand2// F 和 Cr 参数生成从正态分布生成 F ∈ [0,1]从记忆库中选择 Cr 值并添加噪声// EB混合策略选择生成随机数 Rand_EB如果 Rand_EB < EB_hybrid_rate:// 使用EB策略EB_hybrid_flag[TheChosenOne] = 1重新选择 prand, Rand1, Rand2 使用特定分布调用 EB_order 排序三个个体从柯西分布或正态分布生成 F 和 Cr应用边界约束到 F 和 Cr执行EB变异策略:Trial = PopulFront[TheChosenOne] + F*(best - PopulFront[TheChosenOne]) + F*(medium - worst)否则:// 使用经典DE策略EB_hybrid_flag[TheChosenOne] = 0执行经典DE变异策略:Trial = PopulFront[TheChosenOne] + F*(Popul[prand] - PopulFront[TheChosenOne]) + F*(PopulFront[Rand1] - Popul[Rand2])// 边界处理对 Trial 中超出边界的变量进行重置// 评估新解TempFit = f(Trial)如果 TempFit <= FitArrFront[TheChosenOne]:将 Trial 添加到成功集更新适应度和种群记录成功的 F 和 Cr 值// 环境选择更新 EB_hybrid_rate 参数SuccessRate = 成功个体数 / NP动态调整种群大小移除最差个体以维持种群大小更新记忆库中的 F 和 Cr 值// 种群维护如果种群超限则进行排序和截断更新代数计数器返回: 全局最优解和最优值

IV 实验与结果

A. 指标及如何阅读表 I

对于每个 CEC 2025 函数（F1-F29），我们进行了 25 次独立试验，并报告了最终目标值的最优值/平均值/标准差/最差值（值越小越好）。所有问题都是单目标边界约束问题，因此不存在可行性问题，也无需报告约束违反值。零或接近零的条目表示达到了目标精度（CEC 函数经过平移/旋转但具有已知的最优值；由于打印精度，数值零可能显示为 $10^{-k}$ ）。

如何阅读：(i) 最优值-平均值-最差值行且标准差≈0（例如，F1-F5 中的几个单元格）意味着所有 25 次运行都具有高度稳定的收敛性；(ii) 最优值与平均值之间存在较大差距，同时标准差较大（例如，某些 F9/F12-F19/F25/F29 的单元格）表明部分运行中存在多峰性或后期停滞现象；(iii) 复合/混合函数（F21-F29）通常会产生较高的平均值和标准差，这是意料之中的，因为其难度增加了。所有数值均是在相同的评估预算下，根据每次运行的最终最佳解计算得出的。

B. 总体排名（U分数）

给定一组算法 $A\mathcal{A}$ 和函数 $F\mathcal{F}$ ，我们使用平均最终目标值作为主要标准（值越低越好）计算每个函数的排名。打破平局的顺序依次为：标准差（越低越好）、然后是最优值（越低越好）、接着是最差值（越低越好）。对于算法 $a∈Aa\in\mathcal{A}$ ，其聚合 U 分数为：

$U(a)=∑m∈Frankm(a)U(a)=\sum_{m\in\mathcal{F}}\mathrm{rank}_{m}(a)$

且 $U (a)$ 越低表示整体性能越好。为检验显著性，我们对每个函数的平均值（按函数配对）应用 Wilcoxon 符号秩检验，并采用 Holm-Bonferroni 校正，显著性水平 $α=0.05\alpha=0.05$ 。可选地，我们还报告效应大小 $r=Z/∣F∣r=Z/\sqrt{|\mathcal{F}|}$ ，并且在多算法比较中，进行 Friedman 检验及后续的 Nemenyi 事后分析。

表 I 展示了按 U 分数计算的排名（值越小越好）。LSRTDE 是 CEC’24 的冠军算法。在相同的 SOP 测试集上，RDEx 相较于先前的 SOP 算法取得了显著的改进，这进一步证实了 RDEx 机制的有效性。
在这里插入图片描述

参考文献（REFERENCES）

[1] R. Storn and K. Price, “Differential evolution– a simple and efficient heuristic for global optimization over continuous spaces,” J. Global Optim., vol. 11, no. 4, pp. 341–359, 1997.
[2] R. Tanabe and A. Fukunaga, “Success-history based parameter adaptation for differential evolution,” in Proc. IEEE CEC, pp. 71–78, 2013.
[3] R. Tanabe and A. Fukunaga, “Improving the search performance of SHADE using linear population size reduction,” in Proc. IEEE CEC, pp. 1658–1665, 2014.
[4] J. Zhang and A. C. Sanderson, “JADE: Adaptive differential evolution with optional external archive,” IEEE Trans. Evol. Comput., vol. 13, no. 5, pp. 945–958, 2009.
[5] T. J. Choi and C. W. Ahn, “An improved LSHADE-RSP algorithm with the Cauchy perturbation: iLSHADE-RSP,” Knowledge-Based Systems, vol. 215, Art. no. 106628, 2021
[6] Y. Song, D. Wu, A. W. Mohamed, X. Zhou, B. Zhang, and W. Deng, “Enhanced success history adaptive DE for parameter optimization of photovoltaic models,” Complexity, vol. 2021, no. 1, Art. no. 6660115, 2021.
[7] V. Stanovov et al., “Success Rate-based Adaptive Differential Evolution (L-SRTDE) for the CEC 2024 Competition,” in Proc. IEEE CEC, 2024.

查看全文

http://www.dtcms.com/a/499746.html