当前位置：首页 > news >正文

论文略读（2025.3.18-更新中）

news 2025/10/19 19:43:28

关于可控视频生成

I2V3D: Controllable image-to-video generation with 3D guidance
Image to Video工作，能够实现给一张图，输出一个视频，且可以控制相机。动态信息来自于用户手工设计（相机移动，人体骨骼驱动）。
pipeline：先image分割前背景，背景用viewcrafter操控，前景得到mesh。然后在blender中编辑使之运动。用render的video提几个关键帧用SDXL过一下，得到真实一点的关键帧，再用SVD插帧。
请添加图片描述
ReCamMaster
可控制相机的video编辑。输入一段video，通过给定新的相机轨迹，输出新相机下的video。通过相机内外参控制。
比较了三种camera control的方法：frame-dimension(本篇）, channel-dimension, view-dimension。其中frame的最佳。具体是f帧变2f帧，作为condition。
请添加图片描述

深度估计

DepthCrafter
视频深度估计方法，基于扩散模型。不需要相机pose。三阶段训练，可以支持超长视频的深度估计（对应一个创新点）
请添加图片描述

img-to-3d human

LHM: Large Animatable Human Reconstruction Model for Single Image to 3D in Seconds
https://github.com/aigc3d/LHM
请添加图片描述

http://www.dtcms.com/a/78633.html

相关文章：

盘泰UV种植体：抗老化新科技，焕发种植牙新活力

Xilinx系列FPGA视频采集转HDMI2.0输出，基于HDMI 1.4/2.0 Transmitter Subsystem方案，提供6套工程源码和技术支持

设计模式之建造者模式

【深度学习入门_机器学习理论】支持向量机（SVM）

【总结】Pytest vs Behave，BDD 测试框架哪家强？

SpringSecurity配置(自定义认证过滤器)

基于deepseek的智能语音客服【第三讲】知识库封装

Rust会取代Java吗？Rust与Java对比

【商城实战(49)】解锁小程序端适配与优化，让商城飞起来

druid开启防火墙之后的bug

【MySQL】架构

从基础到实践（十九）：DC/DC由来和工作原理介绍

数据源支持远程Excel/CSV，数据集支持分组字段功能，DataEase开源BI工具v2.10.6 LTS版本发布

YOLO11报错：AttributeError: module ‘torch‘ has no attribute ‘OutOfMemoryError‘

Pytorch使用手册—自定义函数的双重反向传播与自定义函数融合卷积和批归一化（专题五十二）

蓝桥杯算法分享：征服三座算法高峰

TensorFlow 的基本概念和使用场景

该错误是由于`KuhnMunkres`类未定义`history`属性导致的

【橘子websocket】如何基于vertx来构建websocket聊天室(上)

JS—原型与原型链：2分钟掌握原型链

《AI大模型开发笔记》——企业RAG技术实战

【杂记二】git, github, vscode等

2025火狐插件被禁用解决方案 could not be verified for use in Firefox and has been disabled

用ASCII字符转化图片

Linux怎样源码安装Nginx

论文学习11：Boundary-Guided Camouflaged Object Detection

分享下web3j 常见用法

ECharts仪表盘-仪表盘10，附视频讲解与代码下载

深入解析素数筛法：从埃氏筛到欧拉筛的算法思想与实现

WindowsAD域服务权限提升漏洞