当前位置：首页 > news >正文

【valse2025】CV与ML领域重要进展

news 2025/9/22 22:08:46

在这里插入图片描述

文章目录

背景介绍
十六个热门方向
一、Al for Science(Al4S)成为科研新范式，正推动科学发现领域迈向新高度
二、具身智能和空间智能持续火热，世界模拟加速落地推动具身智能进化
三、DeepSeek-R1点燃复杂推理大模型热潮，迅速拓展至视觉领域
四、在语言模型驱动下，视觉理解与生成架构趋于统一
五、可控图像/视频生成方法百花齐放
六、垂直领域大模型稳步发展，百花齐放
七、长视频理解任务受到善遍关注，成为多模态理解的重要课题
八、世界模型雏形涌现，成为推动智能体迈向更高层次通用智能的关键引擎
九、多模态基础大模型成为业界“标准配置”
- 在这里插入图片描述
十名往后

背景介绍

在这里插入图片描述

几大进展的标题来源于：

1.评选2024年5月-2025年4月之间，世界范围内视觉与学习领域的重要学术进展。
2.责任AC提名候选进展共16个，通过组委会评议;VALSE2024-2025全体AC投票(选择6-12个进展)。截止5月18日，共收集有效选票128份，超过2/3的AC参与了投票。
3.加权计算得分:若某个AC投票N个进展，则该AC为其投票的每个进展贡献1/N投票分。
4.每个候选项总得分等于所有AC投票分之和，得票率等于总得分除以最大可能投票分。

十六个热门方向

在这里插入图片描述

一、Al for Science(Al4S)成为科研新范式，正推动科学发现领域迈向新高度

来源：“东方理工大学”-金鑫。AI重构整个科学研究领域。
在这里插入图片描述

二、具身智能和空间智能持续火热，世界模拟加速落地推动具身智能进化

中科院计算所-高林。具身智能视角下的时间、空间、物理感知力。CV是光学物理，实际客观世界还有力学、热学

在这里插入图片描述

三、DeepSeek-R1点燃复杂推理大模型热潮，迅速拓展至视觉领域

来源于“港中文”-岳翔宇

在这里插入图片描述

四、在语言模型驱动下，视觉理解与生成架构趋于统一

来源于“微软亚洲研究院”-元玉慧

在这里插入图片描述

五、可控图像/视频生成方法百花齐放

来源“北航”-于茜。与世界模型一脉相承

在这里插入图片描述

六、垂直领域大模型稳步发展，百花齐放

利物浦大学-程光亮。类似于教育的研究生与博士阶段，专用领域模型。

在这里插入图片描述

七、长视频理解任务受到善遍关注，成为多模态理解的重要课题

来源于“华为”谢凌曦。从图像、短视频，到长视频的理解是很自然的趋势。在这里插入图片描述

八、世界模型雏形涌现，成为推动智能体迈向更高层次通用智能的关键引擎

数据来源于“彭程实验室”-杨文瀚。SORA的发布被认为是世界模型的雏形。世界模型主要用于建模，预测，具有重要应用空间。

在这里插入图片描述

九、多模态基础大模型成为业界“标准配置”

此资料收集于“南京大学”叶翰嘉。

十名往后

在这里插入图片描述

视觉就是语言：
在这里插入图片描述

http://www.dtcms.com/a/243026.html

相关文章：

python打卡训练营打卡记录day50

【Java工程师面试全攻略】Day7：分布式系统设计面试精要

蓝牙 BLE 扫描面试题大全(2)：进阶面试题与实战演练

聊聊 Pulsar：Producer 源码解析

python打卡day50

常见的http状态码

重温经典算法——二分查找

Word中如何对文献应用的格式数字连起来，如：【1-3】

【SQL学习笔记3】深入理解窗口函数的用法

Java SE - 数组

svg预览器

嵌入式学习Day35

Debian系统简介

今日行情明日机会——20250610

【WiFi扫描相关帧】

WHAT - 组件库开发场景 - 完全无样式的 UI 组件库 Headless UI

从0到1：HBase安装与操作指南

Web应用压力测试详解

PostgreSQL 的扩展pg_surgery

PostgreSQL--安装方法

6.10

【Dv3Admin】系统视图角色菜单API文件解析

JxBrowser 7.43.2 版本发布啦!

srs linux

asio之读写

解决克隆Github源码库时的Permission denied 问题

JAVA中的多线程

对DOM操作与 jQuery的简单理解（通俗

【数组和二分查找】

鹰盾播放器禁止录屏操作的深度技术解析与全栈实现方案