【文献笔记】Task allocation for multi-AUV system: A review
Task allocation for multi-AUV system: A review
多AUV系统的任务分配
作者:Chaoqun Wang
单位:海军工程大学
期刊:Ocean Engineering
时间:2022-12-15
概述
研究背景
自主水下航行器(AUV)作为一种无人水下航行器,是扩展人类水下视野的关键技术。AUV在民用领域可用于铺设管道、海底勘测、数据收集和设备维护等;在军事领域可用于侦察、打击、扫雷和救援等。
然而,单个AUV的能力有限,因此多AUV(MAUV)系统应运而生,旨在提高单体操作能力并更高效地完成任务。相比单个AUV,多AUV系统具有显著优势:
- 集体决策能力:通过单体自主性实现集体决策和群体层面的稳态。
- 高可扩展性和稳定性:可以增减集群中的个体成员而不会对系统产生决定性影响,使系统具有鲁棒性。
- 执行复杂任务的能力:能够执行单个AUV无法独立完成的任务,例如围捕任务。
为了充分发挥多AUV系统的效能,合理分配资源并有序执行复杂任务,“任务分配”成为了一项决定整体完成效率的关键技术和研究重点。任务分配指的是,在多AUV系统被赋予总体任务后,根据区域内每个AUV的位置、姿态和状态,进行AUV子任务的分配。
研究贡献
作为一篇综述性论文,其主要贡献在于对现有任务分配方法的系统性梳理和分析,具体包括:
- 宏观视角:旨在为该领域的研究人员提供一个关于多AUV系统任务分配模型和算法的宏观印象,以便他们能更全面地改进算法。
- 系统性分类:将现有的任务分配算法大致分为中心化和分布式两大类,并从任务类型、是否异构(即需要不同种类的AUV)、时变性(静态/动态)和空间维度等多个角度对任务分配问题进行了分类(见下图)。
- 算法介绍对比:详细列举了各类中的关键算法,分析了它们的原理、适用场景,并比较了各自的优缺点。
- 展望未来:对该领域未来值得进一步研究的方向进行了展望和建议,为后续研究提供了参考。
图1.任务分配分类图
研究方法
问题定义与建模
任务分配旨在为一组给定的任务(n个)和一组可用的AUV(m个)找到一个最优匹配,其系统目标是在满足所有约束条件的前提下,最大化收益并最小化成本。
-
收益函数 (Revenue Function)
任务完成后,AUV产生的直接价值,由任务的完成度和重要性决定。
R=α∑∑cijlijwijR = \alpha \sum \sum c_{ij} l_{ij} w_{ij}R=α∑∑cijlijwij
其中:- c_ijc\_{ij}c_ij: 一个二元变量。当第i个AUV执行第j个任务时为1,否则为0。
- l_ijl\_{ij}l_ij: 第i个AUV执行第j个任务的完成水平,取值范围为 [0,1][0, 1][0,1]。
- w_ijw\_{ij}w_ij: 第j个任务的重要性,取值范围为 [0,1][0, 1][0,1]。
- α\alphaα: 权重系数。
-
成本函数 (Cost Function)
AUV从移动到指定区域到完成任务的全过程所付出的代价,包括功耗、时间消耗等。
C=β∑i=1m∑j=1ncij(Eij+Tij)τiC = \beta \sum_{i=1}^{m} \sum_{j=1}^{n} c_{ij}(E_{ij} + T_{ij})\tau_iC=βi=1∑mj=1∑ncij(Eij+Tij)τi
其中:- c_ijc\_{ij}c_ij: 同上,表示任务分配关系。
- E_ijE\_{ij}E_ij: 第i个AUV完成第j个任务的功耗损失,取值范围为 [0%,100%][0\%, 100\%][0%,100%]。
- T_ijT\_{ij}T_ij: 第i个AUV完成第j个任务的时间消耗。
- τ_i\tau\_iτ_i: 一个二元变量,表示第i个AUV完成任务后是否能继续使用。如果不能,则为0,否则为1。
- β\betaβ: 权重系数。
-
目标函数 (Objective Function)
系统有效性J被定义为收益R减去成本C,目标是使其最大化。
Max J=R−C\text{Max} \ J = R - CMax J=R−C -
约束条件 (Constraints)
- 任务执行约束: 每个任务必须由至少一个AUV执行。
1≤∑i=1mcij≤n1 \le \sum_{i=1}^{m} c_{ij} \le n1≤i=1∑mcij≤n - 能源约束: 第i个AUV的剩余功率 P_iP\_iP_i 必须大于或等于其执行任务所需的功率损耗 E_iE\_iE_i。
Pi≥EiP_i \ge E_iPi≥Ei - 异构匹配约束: 在异构任务分配中,AUV的功能类型必须与任务类型相匹配。
- 任务执行约束: 每个任务必须由至少一个AUV执行。
算法分类
中心化分配方法 (Centralized Allocation Method)
原理:每个AUV将其环境信息和执行任务的成本函数传输给一个控制中心。控制中心掌握所有AUV的位置和状态,根据任务需求进行全局权衡和统一分配。AUV只负责“执行”而不参与“决策”。
优点:管理者可以分析全局信息,从而得出整个系统的最优分配方案,系统更稳定。
缺点:高度依赖水下通信,对控制中心的计算负担重;可扩展性差,对动态环境反应慢。
-
线性规划法 (Linear Programming Method):
- 描述:将任务分配问题视为0-1整数线性规划问题。早期的求解方法主要有单纯形法和匈牙利法。匈牙利算法适用于“项目-目标”一对一匹配的优化问题。
- 限制:仅适用于最简单的情况(一个机器人一个任务),且要求目标函数是线性的,这在实际问题中往往难以满足,通常需要对模型进行简化,从而影响精度。
-
目标聚类法 (Target Clustering Method):
- 描述:通常用于处理大量目标群,通过K-means聚类或模糊聚类等方法将目标分组,以减少组合空间,为后续任务分配做准备。
- 限制:K-means聚类需要预先指定簇的数量,且结果对初始值敏感。模糊聚类在使用欧氏距离时,在噪声环境下不够稳定。
-
遗传算法 (Genetic Algorithm, GA):
- 描述:一种模仿生物进化机制的随机全局搜索和优化方法。其本质是高效、并行、全局的搜索方法,通过概率性变化规则引导搜索方向,减少了陷入局部最优解的风险。
- 限制:编码标准不高,表达精度可能较差;单个编码可能无法完全表达复杂的约束条件;效率通常低于其他传统优化方法。
-
蚁群算法 (Ant Colony Algorithm):
- 描述:模拟蚁群智能觅食行为的仿生优化算法。通过计算状态转移概率来选择下一个节点,并不断更新信息素,最终找到最短路径。
- 限制:传统蚁群算法存在搜索时间长、易陷入局部最优解的缺点。即使是优化后的算法,虽然能有效解决静态和动态分配问题,但收敛速度仍然较慢。
-
粒子群优化算法 (Particle Swarm Optimization, PSO):
- 描述:受鸟群觅食行为启发的优化算法。因其计算速度快和易于实现而广受欢迎。搜索过程利用反馈原理和并行计算技术,搜索效率高。
- 限制:容易陷入局部最优。应用于离散变量问题(如任务分配)时,需要对算法进行离散化处理。后续研究的重点是减少算法对参数的依赖性,并加强局部搜索能力以实现全局最优。
分布式分配方法 (Distributed Allocation Method)
原理:决策权不完全属于单个AUV,而是赋予每个成员一定的自主决策能力。成员基于局部信息,通过相互“协商”来制定分配方案。
优点:对通信的依赖性小,执行速度快。并行计算、分散通信,具有更好的可扩展性和鲁棒性,更适合水下系统和大规模动态系统。
缺点:由于成员无法掌握全局信息,可能存在竞争关系,难以保证解的全局最优性。
-
合同网算法 (Contract Network Algorithm):
- 描述:模仿经济行为中的“招标-投标-中标-签约”机制来实现任务分配。AUV在模型中被分为招标方(任务管理者)、投标方和中标方(任务执行者)。
- 限制:在投标过程中,大量潜在投标方会增加无效投标,给招标方评估带来负担,容易导致分配不合理。当能力更强的个体在合同建立前处于繁忙状态时,管理者只能选择能力有限的承包商,导致解可能不是最优的。
-
市场拍卖算法 (Market Auction Algorithm):
- 描述:通过拍卖方(任务发布者)和AUV(任务执行者)之间的任务拍卖来实现分布式任务分配。具有计算复杂度低和运行效率高的优点。
- 限制:大多数研究只考虑了智能体(AUV)的利益,而忽略了拍卖方的利益,不完全符合市场规律。如果多个任务同时等待完成,任务的发布顺序会间接影响整体完成效率。
-
自组织映射 (Self-Organizing Map, SOM) 算法:
- 描述:一种自组织映射神经网络,适用于动态环境下的任务分配。系统中的每个AUV通过相互竞争的原则完成任务分配,具有高度的自主性。
- 限制:与市场拍卖算法类似,如果存在多个并行任务,它们仍需按任务发布顺序严格分配,因此发布顺序是影响系统整体效能的关键因素。
仿真实验对比
为了直观展示各算法的优劣,论文选取了SOM、蚁群(Ants)、遗传算法(GA)、粒子群(PSO)和拍卖(Auction)五种经典算法进行仿真对比。
- 实验设置
- 案例1 (大规模,一对多):100个AUV被平均分配到10个目标,模拟每个目标需要10个AUV来完成的场景(图5a)。
- 案例2 (小规模,一对一):6个AUV被平均分配到6个目标,模拟每个目标需要1个AUV来完成的场景(图5b)。
任务分配后的示意图
- 实验目标
目标函数是计算分配完成后,AUV到其所属目标的直线距离总和,即要求算法协调全局,以最小化系统的总距离成本。 - 实验结果与分析
- 拍卖算法表现最优:无论是在总距离还是迭代时间上,无论分配规模大小,拍卖算法都优于其他算法。
- 元启发式算法的局限性:蚁群、GA和PSO等元启发式算法在小规模任务分配中表现尚可,但在大规模分配中暴露了收敛速度慢和易陷入局部最优的缺点。
- SOM算法的鲁棒性:SOM算法采用相互竞争来制定分配方案,而不是搜索全局,因此无论分配规模大小,都体现出其鲁棒性和高适应性。
- 中心化方法的挑战:中心化分配方法会占用大量内存进行运算,并且对水下通信提出了巨大挑战。
结论、限制与未来方向
结论与限制
论文总结了任务分配的核心是最大化集群优势,并通过合理分配任务来最小化执行时间或能耗。
- 中心化方法:在通信状况良好的情况下是首选,管理者能基于全局信息制定出全面客观的分配方案。但其缺点是计算量大,且对通信的可靠性有很强的依赖。
- 分布式方法:在通信不佳的情况下更能发挥AUV自身的优势。它利用个体间的良性竞争机制来选择最合适的执行者,有效保证了系统整体效能。但其缺点是可能无法得到全局最优解,且分配方案单一,无法满足人工临时分配等特定需求。
在实际应用中,通常需要根据实际需求将两种方法结合起来,以达到更理想的效果。
未来研究方向
-
并行任务分配 (Parallel Task Allocation):
传统算法多采用序列分配,任务顺序会影响分配效果,且无法保证所有任务的及时性。未来的研究需要关注高效的协同多任务分配方法,实现任务的并行处理,这对提高多AUV系统的效能至关重要。 -
分层规划 (Layered Planning):
将复杂的协同规划问题分解为多个层次,如决策层、路径规划层和控制层等。- 决策层:负责顶层任务决策、任务分配与再分配、冲突解决等。
- 路径规划层:负责任务执行中的运动规划,生成适应海洋环境的安全路线。
- 控制层:确保AUV精确沿路径航行。
这种分层规划的思想可以有效梳理和降低多AUV协同规划的复杂性,是解决任务分配问题的有效手段。