当前位置: 首页 > news >正文

哈工大提出空间机器人复合框架,突破高精度轨迹跟踪

基于学习的任务空间轨迹规划框架:面向不确定性空间机器人的预规划与后处理方法

    在浩瀚太空执行装配、维修、 碎片清除等复杂任务时,自由漂浮空间机器人(FFSR)的精准操控是关键。但这类机器人因基座与机械臂的强动力学耦合,加上实际任务中模型参数难精确获取,轨迹规划一直是行业痛点。近日,哈尔滨工业大学团队在《IEEE Transactions on Aerospace and Electronic Systems》发表研究,提出融合预规划与强化学习后处理的复合框架,成功实现不确定环境下的高精度轨迹跟踪,为空间机器人在轨作业提供了新方案。

    • 论文标题:Learning-Based Task Space Trajectory Planning FrameWork With Preplanning and Postprocessing for Uncertain Free-Floating Space Robots

    • 论文链接:https://ieeexplore.ieee.org/document/10834588

     

     

    研究背景:空间机器人的“轨迹困境”

    自由漂浮空间机器人(FFSR)无需主动控制基座,凭借低能耗优势成为空间任务的核心装备。但其独特的动力学特性带来两大难题:

    • 强耦合效应:机械臂运动时,基座会因动量守恒被动晃动,末端执行器的最终位置不仅取决于关节角度,还与运动历史相关,传统规划方法易积累误差。

    • 模型不确定性:实际任务中,机器人质量、惯性等参数可能因燃料消耗、载荷变化而偏离标称值,直接导致轨迹跟踪精度下降。

     

    现有技术中,优化方法虽能处理约束,但无法在线调整;纯强化学习(RL)虽能学习不确定性,却因探索空间过大、收敛慢而难以实用。如何兼顾精度、效率与抗干扰能力?哈工大团队给出了创新答案。

     

     

    创新框架:预规划“铺路”+后处理“纠偏”

    团队提出的复合框架将自适应伪谱预规划(ARPM)李雅普诺夫强化学习后处理(LSAC) 结合,形成“基线引导+误差补偿”的双重保障。

     

    1. 自适应伪谱预规划:为轨迹“画蓝图”

    基于机器人标称模型(已知参数的理想模型),ARPM通过以下步骤生成高精度基线轨迹:

    • 将连续时间的轨迹优化问题转化为离散非线性规划问题,用勒让德-高斯-拉道(LGR)点插值逼近轨迹。

    • 自适应调整子区间数量和插值点密度:若某段轨迹误差过大,通过曲率分析判断是“剧烈变化”还是“平缓变化”,动态细分区间或增加插值点,确保基线精度。

    2. 强化学习后处理:为轨迹“修偏差”

    针对模型不确定性,LSAC强化学习模块通过误差反馈实时补偿:

    • 训练时引入随机参数扰动(如质量±35%、末端载荷增至300%),让智能体学习应对各类不确定性。

    • 以末端执行器位置误差为状态输入,输出关节角速度调整量,与预规划轨迹叠加形成最终控制指令。

    • 创新性引入李雅普诺夫函数约束,确保强化学习策略收敛稳定,避免局部最优。

    核心优势:精度、效率、稳健性全面升级

    相比传统方法,该框架在三大维度实现突破:

    • 更高精度:通过预规划基线+后处理补偿,末端轨迹跟踪误差比纯优化方法降低一个数量级,比纯强化学习降低60%以上。

    • 更强稳健性:在极端工况(如基座质量减少50%、末端载荷增至400%)下,误差仍控制在毫米级,远超同类技术。

    • 实时响应:预规划离线完成,后处理仅需0.67毫秒计算时间,满足在轨任务实时性需求。

    实验验证:从模拟到硬件,性能全达标

    团队通过数值仿真与气浮平台实验双重验证框架有效性。

     

     

    数值仿真实验

    基于3自由度平面自由漂浮空间机器人(FFSR),模拟不同质量不确定性场景,对比方法包括本文框架(M1)、纯预规划(M3)、纯强化学习(M5)、多目标优化(M6)和深度学习(M7)等。

    1. 实验设置

    • 机器人模型:3-DoF平面FFSR,基座质量15.0kg,Link3质量0.15kg(易受载荷影响)。

    • 不确定性范围:基座及Link1-2质量变化率±35%,Link3(末端载荷)变化率-35%~300%,模拟极端加载场景。

    • 任务目标:末端执行器沿直线从初始位置运动至([0.57, 0.18]^T m),跟踪误差需最小化。

     

    2. 核心结果

    • 轨迹精度对比:在典型不确定性下,M1的末端轨迹与期望轨迹几乎重合,而M3(纯预规划)因未补偿误差累积显著,M5(纯强化学习)收敛困难;M1的均方误差(MSE)显著低于其他方法,比M3降低约94%,比M7(深度学习)降低约88%(图4)。

       

    • 稳健性验证:20组随机不确定性场景下,M1的末端轨迹始终最接近期望轨迹MSE最小,而M3、M6(多目标优化)因忽略不确定性精度较低(图7);极端工况下,Link3质量增至400%或基座质量减少50%(超训练范围)时,M1误差仍保持毫米级,体现强稳健性(图9-10)。

     

     

    • 计算效率:M1平均计算时间仅0.67ms,远低于优化类方法(M3需3365ms),满足实时规划需求(表IV)。

       

    硬件实验

    基于气浮平台模拟微重力环境,通过加载铅块引入质量不确定性,验证框架在物理系统中的实用性。

    1. 实验设置

    • 平台特性:气浮平台残余加速度仅(2×10^{-5}g),模拟微重力;机器人参数与仿真标称值基本一致。

    • 不确定性场景

      • 场景1:基座加载(质量+20%);

      • 场景2:末端加载(Link3质量+300%);

      • 场景3:多部件加载(基座+7%、Link2+50%、Link3+200%)。

     

    2. 核心结果

    (1)轨迹精度对比

    • 基座加载场景:M1的MSE为0.24×10⁻⁴,仅为M3(纯预规划)的6.3%,M5(纯强化学习)因硬件噪声误差最大(图12(f))。

     

    • 末端加载场景:M1的MSE为0.74×10⁻⁴,优于M7(6.42×10⁻⁴),验证对末端载荷变化的适应性(图15(f))。

     

    • 多场景汇总:三类不确定性下,M1和M2(能量优化预规划+后处理)的MSE均为最小,显著低于其他方法(表VII)。

     

    (2)硬件稳定性

    尽管硬件噪声导致关节速度轻微抖动,但关节角度变化平滑,末端仍能精准跟踪轨迹。

     

     

    实验结论

    1. 精度优势:复合框架(M1)在仿真和硬件实验中均实现最小轨迹误差,比纯优化方法降低1-2个数量级,比纯学习方法降低60%以上。

    2. 稳健性:在极端不确定性和硬件噪声下,误差仍控制在毫米级,验证了对模型不确定性的强适应性。

    3. 实时性:毫秒级计算时间满足在轨任务实时需求,优于传统优化方法。

    预规划与强化学习后处理的结合,有效解决了自由漂浮空间机器人在模型不确定性下的高精度轨迹规划难题。

    未来展望:迈向更通用的空间机器人技术

    该框架已在单机器人任务中验证有效性,团队下一步将聚焦:

    • 提升对不同自由度、尺寸的FFSR的适应性,减少构型变化时的重新训练成本。

    • 拓展至多机器人协同场景,助力更复杂的在轨组装、集群作业。

    从精准捕获太空碎片到维护卫星设备,空间机器人的每一次精准移动都离不开轨迹规划技术的突破。哈工大这项研究为不确定环境下的空间机器人操控提供了“中国方案”,让太空任务更安全、更高效!

    原文链接:哈工大提出空间机器人复合框架,突破高精度轨迹跟踪 | 科技攻关

     


    文章转载自:

    http://MVtTHdnI.rykmf.cn
    http://a2v2qlwx.rykmf.cn
    http://EYlUs4Yf.rykmf.cn
    http://zbSikBDk.rykmf.cn
    http://OcLd0vlf.rykmf.cn
    http://iQycajLC.rykmf.cn
    http://8eBRz1xE.rykmf.cn
    http://2aqSMv0o.rykmf.cn
    http://T9fWfvlq.rykmf.cn
    http://Qs3mdnPM.rykmf.cn
    http://UuBlDXhG.rykmf.cn
    http://sVjQ500p.rykmf.cn
    http://plTuzzs2.rykmf.cn
    http://Mk8XYxFe.rykmf.cn
    http://BUwh2Yl2.rykmf.cn
    http://PQ5J7kH2.rykmf.cn
    http://a2cdAgjy.rykmf.cn
    http://e3eZdM7b.rykmf.cn
    http://dTrK4Y6t.rykmf.cn
    http://XT7FdxTO.rykmf.cn
    http://MFOYQQnG.rykmf.cn
    http://tcpOKxLp.rykmf.cn
    http://0SouKwSH.rykmf.cn
    http://ZcXCzCrZ.rykmf.cn
    http://hhftb1m6.rykmf.cn
    http://RZepbLVy.rykmf.cn
    http://2AKgcbXi.rykmf.cn
    http://7WelPTpV.rykmf.cn
    http://ckapSEj0.rykmf.cn
    http://fYoAAerj.rykmf.cn
    http://www.dtcms.com/a/368522.html

    相关文章:

  • 基于智能合约实现非托管支付
  • CC-Link IE FB 转 DeviceNet 实现欧姆龙 PLC 与松下机器人在 SMT 生产线锡膏印刷环节的精准定位控制
  • 分布式微服务--ZooKeeper作为分布式锁
  • Linux中的fork详解
  • 【生产故事会】Kafka 生产环境参数优化实战案例
  • 【Kafka】Kafka使用场景用例Kafka用例图
  • 学习 Android (二十) 学习 OpenCV (五)
  • CodePerfAI体验:AI代码性能分析工具如何高效排查性能瓶颈、优化SQL执行耗时?
  • 【leetcode】46. 全排列
  • GD32入门到实战34--ARM启动流程
  • 针对nvm不能导致npm和node生效的解决办法
  • LeetCode 3027.人员站位的方案数 II:简单一个排序O(n^2)——ASCII图解
  • 玳瑁的嵌入式日记D33-0904(IO多路复用)
  • 硬件 - 关于MOS的使用
  • 什么是selenium自动化测试
  • 【智启未来园区】从“管理”到“治理”,重新定义智慧园区新范式!
  • 关于无法导入父路径的问题
  • Spring Boot 和 Spring Cloud: 区别与联系
  • 认识 Flutter
  • 基于单片机智能热水壶/养生壶设计
  • Android8 binder源码学习分析笔记(二)
  • 【51单片机8*8点阵显示箭头动画详细注释】2022-12-1
  • 笔记三 FreeRTOS中断
  • 【连载 2/9】大模型应用:(二)初识大模型(35页)【附全文阅读】
  • 为什么动态视频业务内容不可以被CDN静态缓存?
  • 【视频系统】技术汇编
  • 如何提升技术架构设计能力?
  • 【数据分享】上市公司数字化转型相关词频统计数据(2000-2024)
  • K8S的Pod为什么可以解析访问集群之外的域名地址
  • (4)什么时候引入Seata‘‘