当前位置: 首页 > wzjs >正文

湛江做网站建设上海城隍庙小吃街攻略

湛江做网站建设,上海城隍庙小吃街攻略,滑板网页网站设计,做网站遇到各种问题北京通用人工智能研究院-通才智能体 LEO 为什么机器人需要理解空间关系? 近年来,多模态大语言模型(MLLMs)在视觉任务上取得了令人瞩目的进步。像GPT-4V、Claude和Gemini这样的模型可以理解图像内容并进行描述,仿佛它们…

北京通用人工智能研究院-通才智能体 LEO

为什么机器人需要理解空间关系?

近年来,多模态大语言模型(MLLMs)在视觉任务上取得了令人瞩目的进步。像GPT-4V、Claude和Gemini这样的模型可以理解图像内容并进行描述,仿佛它们真的"看懂"了图片。然而,这些模型面临一个重要的局限性——它们大多只能处理单一图像的空间理解,就像只能通过一张快照来理解世界,而无法整合多个视角或时间点的信息。

这种局限性严重阻碍了人工智能在机器人和自动驾驶等实际应用中的表现。试想,如果你让机器人"把餐桌上的盘子拿到厨房",它需要从多个角度理解餐桌和盘子的位置关系,然后规划一条路径,最后准确地抓取盘子。这不仅需要理解单帧图像中的空间关系,还需要整合多帧图像的信息,构建一个连贯的环境理解。

甲子光年:2025年具身智能行业发展现状分析,发展挑战与技术趋势-报告智库

如何让AI理解多帧图像中的空间关系?

首先是深度感知(Depth Perception)。想象你正在观察一个房间——有些物体离你很近,有些则很远。人类可以轻松判断物体的远近,这种能力对于理解三维空间至关重要。

其次是视觉对应(Visual Correspondence)。当你从不同角度观察同一个物体时,尽管它在图像中的位置和外观可能变化,但你的大脑会自动识别这是同一个物体。这种能力让研究团队的模型能够在不同图像之间匹配重叠区域,建立一致的场景关联。

动态感知(Dynamic Perception)。这包括理解相机(或观察者)的移动和物体的移动。当你在房间里走动时,你能感知自己的移动方向和速度,同时也能察觉哪些物体保持静止,哪些在移动。

通过整合深度感知、视觉对应和动态感知,Multi-SpatialMLLM展示了在复杂空间任务上的强大能力,为人工智能在现实世界中的应用开辟了新的可能性。

甲子光年:2025年具身智能行业发展现状分析,发展挑战与技术趋势-报告智库

具身多任务多模态的通才智能体 LEO

北京通用人工智能研究院联合北京大学、卡耐基梅隆大学和清华大学的研究人员提出了首个三维世界中的具身多任务多模态的通才智能体 LEO。

通才智能体 LEO 以大语言模型为基础,可以完成感知(perception)、定位(grounding)、推理(reasoning)、规划(planning)和动作执行(acting)等任务。

LEO 的三维视觉语言理解、具身推理和动作执行能力在现实世界中有广泛的应用场景与巨大的应用价值。作为未来的家庭助理,LEO 可以与人交互,回答与场景相关的问题,例如根据用户喜好调整家居布局、帮助用户找到特定物品、为用户的各种问题提供建议。LEO 的导航能力可用于购物中心、办公楼中的智能引导,其操控能力可用于家居自动化任务,如打扫、整理或简单厨房任务,以及仓库和物流中心的物品整理和搬运。

图片

利用 PointNet++ 提取出场景点云中物体级别的特征,随后用空间编码器(Spatial Transformer)对空间位置关系进行建模,从而得到三维场景级别(scene-level)的特征

二维图像则经过预训练模型 OpenCLIP ConvNext 处理得到第一视角的视觉特征。二维和三维的视觉特征最后分别经过 projector 映射到文本空间中。

LLM 方面,采用 Vicuna-7B 作为预训练语言模型来处理 token 序列,训练中,利用 LoRA 方法来微调 LLM

图片


文章转载自:

http://799UHrjN.gmwdL.cn
http://pkwSFzaM.gmwdL.cn
http://i8ScJfj5.gmwdL.cn
http://OXlkNhTI.gmwdL.cn
http://H1fwAfPJ.gmwdL.cn
http://ypYBRDRA.gmwdL.cn
http://EmfcMyLs.gmwdL.cn
http://5y3KhvqE.gmwdL.cn
http://whIlRYr9.gmwdL.cn
http://RJa9841S.gmwdL.cn
http://FZiC8Rdg.gmwdL.cn
http://DkicdXK2.gmwdL.cn
http://iquEWYi9.gmwdL.cn
http://2NoGwpus.gmwdL.cn
http://liTLHeRp.gmwdL.cn
http://Yl7SUMV2.gmwdL.cn
http://3tdpqP7X.gmwdL.cn
http://CpuAqryZ.gmwdL.cn
http://Lvqvm8AI.gmwdL.cn
http://zpnXoXUL.gmwdL.cn
http://WdBHdbhD.gmwdL.cn
http://ceP98P6x.gmwdL.cn
http://3B8oG1RX.gmwdL.cn
http://wWwfmsWG.gmwdL.cn
http://clMTen8k.gmwdL.cn
http://pXvK9oIL.gmwdL.cn
http://C1kZCg7J.gmwdL.cn
http://aeSNNW2y.gmwdL.cn
http://GqWpTXJI.gmwdL.cn
http://RfbrAi5p.gmwdL.cn
http://www.dtcms.com/wzjs/617978.html

相关文章:

  • 如何选网站服务器做图的模板下载网站有哪些内容
  • 中文绿色环保网站模板seo推广代理
  • 站长统计网站松原手机网站开发公司
  • 在线做ps是什么网站哈尔滨模板网站建设
  • 免费大数据网站网站导航栏按钮
  • 建设电影网站的教程飞言情做最好的小说网站
  • 南京网站a建设云世家微信小程序怎么做商城
  • 郴州市做网站上海网站建设中小型企业
  • 网站怎么进入后台管理后端开发和前端开发哪个工资高
  • 网站开发 技术问题网站下面的站长统计很逗
  • 不做百度了 百度做的网站重庆九龙坡营销型网站建设公司推荐
  • 昆明软件开发公司做门户网站的设计网站最重要的是要有良好的
  • 成都网站建设优化公司做网站属于什么行业
  • 卧龙区2015网站建设口碑做网站的数据库
  • 青岛做公司网站国际招聘人才网
  • 比较好的网站开发框架青岛网站开发学校
  • 内网怎么做网站昆山智能网站建设
  • 上线了 网站天津市工程建设交易管理中心网站
  • 主流门户网站有哪些兰溪建设网站
  • 繁体商城网站模板卡盟网站开发
  • 上海c网站建设电商网店开店全过程
  • 动易后台 网站统计调查 报表类型怎样使用wordpress投稿申请
  • php网站开发经理招聘免费咨询服务
  • 做爰动态视频网站哪个做问卷网站佣金高
  • 汉中市住房和城乡建设局网站wordpress 上传腾讯云
  • win2003 建设网站长沙网络推广哪家
  • 手机做任务网站有哪些google seo是什么啊
  • 工程建设监理网站建筑公司网站作用
  • 医院网站建设预算表威海建设信息网站
  • 做网站学生作业接外包的平台