当前位置：首页 > news >正文

WithAnyone: Towards Controllable and ID Consistent Image Generation论文阅读

news 2025/11/5 11:02:58

核心思想

提升人物ID参考生成的一致性
解决现有文本到图像生成模型在进行“身份定制”（ID Customization）时普遍存在的问题：“复制粘贴”伪影（copy-paste artifact）。

解决方案：

大规模数据集（MultiID-2M）：包含大量配对的、多样的同一人物的图片，为模型学习“身份”而非“图像”提供了数据基础。
评测基准（MultiID-Bench）：引入了能定量衡量“复制粘贴”程度的指标，并以此评估模型在身份保真度和生成多样性之间的平衡。
一个新的训练范式和模型（WithAnyone）：利用配对数据和创新的对比身份损失函数，训练出一个能够在保持高度身份一致性的同时，显著减少“复制粘贴”现象的模型。

详细解读

1. 核心问题：“复制粘贴”伪影

现象：现有模型为了追求高的人脸相似度（ID Similarity），会过度拟合参考图片。比如，即使prompt要求人物“微笑”，但如果参考图是“严肃”的，生成图也常常是严肃的，因为模型只是在复制参考图的人脸。
根源：缺乏合适的训练数据。大多数方法使用“重构训练”（Reconstruction Training），即输入和输出是同一张图片。这种训练方式自然会鼓励模型学

http://www.dtcms.com/a/569812.html

相关文章：

无人机远距离无线通信模块：突破空中通信的未来之钥

IDEA：2020.1 下面有四个小版本：2020.1.1 -- 2020.1.4，哪个与Windows7 更兼容

长春建站网站模板网站仿站

【ROS2+相机】在Ubuntu安装realsense-ros

基于B/S架构的物资管理系统的设计与实现（源码+论文+部署+安装）

告别扫描仪！AI一键PBR材质

网站建设公司内幕中企动力科技做什么的

AI代发货(DropShopping)革命：构建自动化电商帝国终极指南

视频网站怎样做一元夺宝网站开发

最近联系人-有点疑惑

RV1126 NO.37:OPENCV的图像叠加功能

时序数据库系列（一）：InfluxDB入门指南核心概念详解

网站建设与维护工作电商网站开发prd

东莞网站推广模式网站设计标杆企业

html 和css基础常用的标签和样式

应用通知如何接入飞书

英语做美食网站免费小程序平台

电子学会青少年机器人技术（四级）等级考试试卷-理论综合（2025年9月）

C语言基于MPI并行计算矩阵的乘法

2020年下半年网络规划设计师案例分析真题及答案解析

LaTeX 2025环境配置：texlive + TeXstudio

工业物联网环境监测新趋势：解析一体化边缘智能节点的价值

收企业做网站备案wordpress主题giligili

经营网站需要什么费用电脑制作网站用哪个软件

CentOS 7 停更后如何配置 YUM 源？（Vault、EPEL、第三方镜像完整指南）

东莞天助网的网站凡科官网登录

Freertos系统，将U盘里的updata.zip解压到当前的U盘，然后进行升级

网站功能模块报价wordpress 图库主题

LIFT：基于低秩引导的稀疏微调

贸易公司怎么做网站比较好凡科互动投票破解