当前位置: 首页 > news >正文

最新发布 | “龙跃”(MindLoongGPT)大模型正式发布!龙跃而起,推动中国方案走向全球智能体前沿

在人工智能快速演进的今天,生成式大模型正成为推动技术变革的核心引擎。继语言、图像、视频等领域实现突破之后,下一阶段的技术焦点,正加速向“具身智能”迁移。具身智能强调智能体对物理世界的感知、理解与互动能力,是实现通用人工智能的关键路径。作为其中的重要分支,人形机器人承载着人工智能在现实世界中落地的希望。

在此背景下,2025年5月,复旦大学联合国家地方共建人形机器人创新中心(以下简称“国地中心”),正式发布全球首款生成式人形机器人运动大模型—— “龙跃”(MindLoongGPT)。

MindLoongGPT开发者测试版本已正式在 OpenLoong 开源社区开放,欢迎点击跳转查阅仓库并参与使用与反馈。


“龙跃”MindLoongGPT:

生成式机器人运动大模型的重要突破

■ 从实验室到产业应用,重新定义人机交互 

人形机器人如何像人类一样自然运动?如何通过语言指令让机器人理解并执行复杂动作?这一直是行业亟待突破的技术瓶颈。国地中心联合复旦大学未来信息创新学院研发的“龙跃”MindLoongGPT大模型,以“自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环。  

■ 四大核心技术优势,引领行业标杆

1. 多模态交互,低门槛驱动

MindLoongGPT支持文本、语音、图像等多模态输入,用户只需说出“挥手致意”或上传一段参考视频,模型即可自动解析语义并生成连贯动作。传统方法依赖专业参数调整的桎梏被打破,真正实现“人人可用”。  

2. 拟真度与时序一致性双突破  

通过将人体动作视为“时序语言”,MindLoongGPT对动作序列逐帧建模,精准捕捉动作间的连续性,解决了长序列生成中的僵硬、跳跃问题。生成的跑步、舞蹈等动作不仅流畅自然,更保留真实人体的惯性节奏。

3. 结构生成与细节优化并重  

模型采用分阶段生成策略,从全局姿态到局部关节角度均实现高精准的控制。无论是手指微操还是全身腾跃,细节表现力媲美真人。

4. 轻量化设计,赋能广泛场景  

在保证性能的前提下,MindLoongGPT模型体积压缩至同类型产品的1/3,可在教育机器人、智能穿戴设备等嵌入式平台实时运行,为产业落地铺平道路。  

MindLoongGPT的差异化竞争力:为什么它是“不可替代”的?

■ 技术为骨,应用为翼,打造全链条解决方案

当前市场中的动作生成模型往往存在两大痛点:一是依赖高算力硬件,难以低成本部署;二是生成结果机械呆板,缺乏可控性。

MindLoongGPT通过三大创新设计,构建了独特的市场护城河:  

1. 自然语言驱动,开启交互新范式

用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如“以优雅的姿势递上一杯咖啡”,MindLoongGPT即可结合语义理解生成对应动作,并支持通过追加指令实时调整细节。

图片

语音到文本的转化

2. 生成+编辑双模式,满足定制化需求  

MindLoongGPT不仅支持一键生成动作,还开放了风格、节奏、速度等参数接口。企业用户可基于生成的初始动作进行二次创作,例如将“步行”调整为“卡通蹦跳”或“机械步态”,极大拓展了模型的适用场景。

图片

图片

动作生成

3. 全链条部署方案,打通最后一公里  

从动作生成到实机部署,MindLoongGPT提供完整的工具链支持——

模型重定向技术:通过优化的retarget算法,实现人体模型与不同机器人URDF结构的快速适配,解决硬件异构难题;

图片

图片

模型重定向

上位控制软件集成:支持主流机器人操作系统(ROS、V-REP等),生成动作可直接导入实机测试,部署效率提升80%。

图片

图片

图片

动作部署

4. 大模型与小模型联合,高效实现各种复杂动作与舞蹈特技:

“龙跃”MindLoongGPT具有7B的模型参数大小,支持text2motion, motion2text, motion2motion多任务,生成更丰富的动作。

通过“龙跃” MindLoongGPT 生成特技动作运动轨迹,作为部署的全身跟踪小模型的输入目标观测,从而可以在青龙上实现丰富的全身动作。

图片

图片

 "龙跃"大模型已经发布:共建开放生态

MindLoongGPT开发者测试版本已正式在OpenLoong开源社区开放,欢迎查阅GitHub仓库并参与使用与反馈。

作为全球首个生成式人形机器人通用大模型,MindLoongGPT的发布不仅是一项技术成果,更是国地中心技术攻坚的里程碑式进展,标志着我国在“生成式AI+具身智能”交叉融合方向实现新的突破。

🔍 此次开源的开发者版本,意味着MindLoongGPT 的能力已具备对外服务基础,为更广泛的技术开发与场景应用创造条件。其核心意义体现在三个方面:

重塑人机协作生态,降低机器人开发门槛:开发者无需具备复杂的运动控制背景,即可通过自然语言指令实现机器人全身动作生成,中小型企业乃至个人开发者都可以基于MindLoongGPT快速构建具身交互应用;

赋能多元场景,推动产业智能化转型:高适配性的动作生成能力使MindLoongGPT可广泛应用于家庭陪护、医疗康复、工业柔性装配等新兴领域,加速人形机器人进入实际应用体系;

抢占国际技术制高点,构建“中国方案”:作为我国在生成式AI与人形机器人深度融合方向的首次系统性技术突破,MindLoongGPT为全球智能体技术发展提供了“中国路径”,展现了我国在AGI演进中的原创力与引领力。

📂 GitHub仓库地址及开发文档请访问OpenLoong 开源社区官网获取,诚邀更多开发者加入生态共建,共同推动具身智能的发展进程。


"OpenLoong" 是全球领先的人形机器人开源社区,秉承技术驱动与开放透明的价值观,致力于汇聚全球开发者推动人形机器人产业发展。由国家地方共建人形机器人创新中心发起的 OpenLoong 项目,是业内首个全栈、全尺寸的开源人形机器人项目,有着人人都可以打造属于自己的机器人的美好愿景,旨在推动人形机器人全场景应用、助力具身智能时代的到来。

欢迎加入 OpenLoong 开源社区,探索人形机器人技术,共享创新成果,在这里一起见证开源的力量!

相关文章:

  • 电脑的虚拟内存对性能影响大吗
  • [go] 垃圾回收源码解析
  • MCU双分区方案,如何优雅地获知当前运行分区?
  • 新高考需求之一
  • pyhton基础【15】函数进阶一
  • 从厨房到代码台:用做菜思维理解iOS开发 - Swift入门篇①
  • ADIOS2 介绍与使用指南
  • Vue3 + Vite + TypeScript SVG图标解决方案
  • 一款基于 React 的开源酷炫动画库
  • C指针总结复习(结合deepseek)
  • 71-Oracle Undo与Flashback管理(Guarantee设置)深度解析
  • 艾立泰数字化方案重塑汽车包装载具管理
  • oracle 表空间与实例妙用,解决业务存储与权限处理难题
  • C++11 static_assert(基于Boost库)从入门到精通
  • Halcon ——— OCR字符提取与多类型识别技术详解
  • STM32学习笔记
  • 全链接神经网络,CNN,RNN各自擅长解决什么问题
  • DataWhale-零基础络网爬虫技术(三、爬虫进阶技术)
  • 使用 catthehacker/ubuntu Docker 镜像部署 GitHub Actions 本地运行环境
  • SpringSecurity6(认证-前后端分离)
  • 公司核名在哪个网站/南京怎样优化关键词排名
  • 常见b2c网站有哪些/竞彩足球最新比赛
  • 图书网站建设方案/seo推广排名软件
  • 江西网站开发软件公司/厦门关键词排名推广
  • 微商城网站建设新闻/360推广开户
  • 做盗版网站会坐牢吗/搜索引擎优化免费