当前位置: 首页 > news >正文

2025年9月第3周AI资讯

本周,各大科技公司在AI领域动作频频,从视频创作到数字人应用,都推出了令人眼前一亮的新工具。

1. YouTube AI 创作工具

img

最近YouTube 推出了一系列人工智能创作工具,并率先在 YouTube Shorts 上线。

  • VOE3Fast 模型集成:YouTube 已将 VO3Fast 模型集成到 Shorts 短视频平台,方便创作者快速将创意转换为视频。
  • 一键风格应用:Shorts 中首次加入了一键风格应用,创作者可通过文本提示,加入新物体等全新的视频编辑功能。
  • 照片动态化 (Amotion):此功能通过模型捕捉人物动作,并将动作序列迁移到新的角色中,合成全新的视频。
  • AI 视频编辑:该功能可以自动处理用户上传的图像素材,并基于模板生成带有背景音乐和解说的完整视频。
  • 对白转歌曲 (Speech-to-Song):由 Larry 2 驱动,允许用户将视频中的对白转换成具有节奏感的歌曲,并选择情绪风格来生成音乐。

2. Luma V3 模型:全球首个推理视频模型

img

本周,Luma 正式推出了 V3 模型,这也是世界上首个推理视频模型。

  • 工作室级别画质:V3 模型可以生成工作室级别的 HDR 高清视频,原生 HDR 可提供演播室级别的保真度,能够生成最高 16 位高动态范围视频,让阴影、细节和高光部分的色彩更加逼真。
  • 全新草稿模式:该模式可在创意工作流中快速迭代,并借助全新的 Wi-Fi 扩散通道将最佳镜头转换为高保真 4K HDR 画质,处理速度非常快。
  • 推理能力:作为一个具备推理能力的视频模型,V3 能够以视觉和语言符号的方式进行思考,用于创建更复杂的场景和错综复杂的动作。
  • 精准视觉控制:R3 可以理解用户输入的视觉注视,创作者可通过涂鸦的方式指导摄像机运动和表演方式,无需提示词也可完成精准视觉控制。
  • 免费体验:该模型已在 Dream Machine 中免费提供。

3. Arcads 数字人新功能:Show Your App

img

数字人平台 Arcads 推出了一项名为 “Show Your App” 的新功能,旨在轻松合成应用程序营销广告。

  • 快速生成广告:广告设计者只需上传 App 截图并选择一个数字人演员,即可快速合成模特手持手机演示 App 的场景,效果非常逼真。
  • 操作简单:只需三个简单的步骤,即可通过脚本驱动数字人,生成一段具备纯形匹配的短视频广告。
  • 全球推广:为了方便全球推广,用户还可以根据不同的国家选择对应的数字人形象。

4. Marble 模型

img

World Labs 正式上线了空间智能最新模型 Marble

  • 3D 世界生成:与上一代模型相比,Marble 能够基于单张图像生成一个可探索的 3D 世界。
  • 空间关系理解:该模型可以理解物体之间的空间关系,画质也有了明显提升。
  • 操作方式:用户可以使用 WASD 移动,并通过鼠标调整视角。

5. ElevenLabs Studio 3.0 工具

img

本周,ElevenLabs 推出了 Studio 3.0 工具,可以一站式完成 AI 语音配音、音效、降噪和剪辑。

  • 功能集成:该工具非常适合制作短视频、播客和有声书。
  • 便捷编辑:Studio 3.0 支持通过编辑文本的方式修改生成的音频,并可以根据场景自动匹配音乐和音效。
  • 简化流程:该工具的发布意味着创作者可以进一步简化音频和视频的剪辑流程。
http://www.dtcms.com/a/394641.html

相关文章:

  • ETL详解:从核心流程到典型应用场景
  • SQL查询基础常用攻略
  • 数据结构二叉树(C语言)
  • Domain、BO、BIZ 三层的协作关系
  • 【从小白到精通之数据库篇】Mysql--连接与子查询
  • C++ 函数详解:从基础到高级应用
  • HTML打包的EXE程序无法关闭?
  • openEuler2403安装Ollama
  • 苍穹外卖项目实战(day11-1)-记录实战教程、问题的解决方法以及完整代码
  • 【Linux命令从入门到精通系列指南】mv 命令详解:文件与目录移动、重命名及安全操作的终极实战手册
  • 【C语言】深入解析阶乘求和算法:从代码实现到数学原理
  • 图形库的基础--svg
  • 令牌桶算法
  • FPGA开发环境配置
  • 特别分享:怎么用coze搭建智能体?
  • Linux 管道
  • NumPy 系列(四):numpy 数组的变形
  • 【Zod 】数据校验新范式:Zod 在 TypeScript 项目中的实战指南
  • 「React实战面试题」useEffect依赖数组的常见陷阱
  • 系统架构设计师部分计算题解析
  • 3.1 BP神经网络结构(反向传播算法)
  • 2026:具身智能软件——开发者工具、范式与方向
  • linux收集离线安装包及依赖包
  • ✅ Python租房数据分析系统 Django+requests爬虫+Echarts可视化 贝壳网全国数据 大数据
  • FREERTOS任务TCB与任务链表的关系-重点
  • C++入门(内含命名空间、IO、缺省参数、函数重载、引用、内联函数、auto关键字、新式范围for循环、关键字nullptr的超全详细讲解!)
  • 红黑树的介绍
  • NumPy 系列(六):numpy 数组函数
  • 手写链路追踪-日志追踪性能分析
  • 数据库自增字段归零(id)从1开始累加