当前位置: 首页 > news >正文

论文略读(2025.3.18-更新中)

关于可控视频生成

I2V3D: Controllable image-to-video generation with 3D guidance
Image to Video工作,能够实现给一张图,输出一个视频,且可以控制相机。动态信息来自于用户手工设计(相机移动,人体骨骼驱动)。
pipeline:先image分割前背景,背景用viewcrafter操控,前景得到mesh。然后在blender中编辑使之运动。用render的video提几个关键帧用SDXL过一下,得到真实一点的关键帧,再用SVD插帧。
请添加图片描述
ReCamMaster
可控制相机的video编辑。输入一段video,通过给定新的相机轨迹,输出新相机下的video。通过相机内外参控制。
比较了三种camera control的方法:frame-dimension(本篇), channel-dimension, view-dimension。其中frame的最佳。具体是f帧变2f帧,作为condition。
请添加图片描述

深度估计

DepthCrafter
视频深度估计方法,基于扩散模型。不需要相机pose。三阶段训练,可以支持超长视频的深度估计(对应一个创新点)
请添加图片描述

img-to-3d human

LHM: Large Animatable Human Reconstruction Model for Single Image to 3D in Seconds
https://github.com/aigc3d/LHM
请添加图片描述

相关文章:

  • 盘泰UV种植体:抗老化新科技,焕发种植牙新活力
  • Xilinx系列FPGA视频采集转HDMI2.0输出,基于HDMI 1.4/2.0 Transmitter Subsystem方案,提供6套工程源码和技术支持
  • 设计模式之建造者模式
  • 【深度学习入门_机器学习理论】支持向量机(SVM)
  • 【总结】Pytest vs Behave,BDD 测试框架哪家强?
  • SpringSecurity配置(自定义认证过滤器)
  • 基于deepseek的智能语音客服【第三讲】知识库封装
  • Rust会取代Java吗?Rust与Java对比
  • 【商城实战(49)】解锁小程序端适配与优化,让商城飞起来
  • druid开启防火墙之后的bug
  • 【MySQL】架构
  • 从基础到实践(十九):DC/DC由来和工作原理介绍
  • 数据源支持远程Excel/CSV,数据集支持分组字段功能,DataEase开源BI工具v2.10.6 LTS版本发布
  • YOLO11报错:AttributeError: module ‘torch‘ has no attribute ‘OutOfMemoryError‘
  • Pytorch使用手册—自定义函数的双重反向传播与自定义函数融合卷积和批归一化(专题五十二)
  • 蓝桥杯算法分享:征服三座算法高峰
  • TensorFlow 的基本概念和使用场景
  • 该错误是由于`KuhnMunkres`类未定义`history`属性导致的
  • 【橘子websocket】如何基于vertx来构建websocket聊天室(上)
  • JS—原型与原型链:2分钟掌握原型链
  • 51岁国家移民管理局移民事务服务中心联络部副主任林艺聪逝世
  • 五一假期“热潮”来袭,计划南下的小伙伴注意了
  • 陈平评《艺术科学的目的与界限》|现代艺术史学的奠基时代
  • 面对面倾听群众意见建议,及时回应解决群众“急难愁盼”问题!龚正在基层开展下访活动,调研城市更新
  • 中信证券:“国家队”未曾减持ETF,应充分相信国家维稳决心
  • 谭秀洪任广西梧州市人大常委会党组书记,此前任北海市委常委