当前位置: 首页 > news >正文

南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。

(1Prompt1Story)是一种无训练的文本到图像生成方法,通过整合多个提示为一个长句子,并结合奇异值重加权(SVR)和身份保持交叉注意力(IPCA)技术,解决了生成图像中身份不一致的问题,同时保持了文本描述的精准对齐。

相关链接

  • 论文:https://arxiv.org/abs/2501.13554

  • 代码:https://github.com/byliutao/1Prompt1Story

  • 主页:https://byliutao.github.io/1Prompt1Story.github.io/

论文介绍

论文出了一种无需训练的方法1Prompt1Story,通过单个连接提示实现一致的文本到图像生成。我们的方法可以应用于所有基于文本嵌入的文本到图像模型。此外,它还支持多字符生成、ControlNet 引导生成和个性化生成逼真的图像。

方法

(a):1Prompt1Story 的整体流程。我们将身份提示和框架提示合并为一个提示,然后应用奇异值重加权 (SVR) 和身份保留交叉注意力 (IPCA) 来生成身份一致的图像。(b):在SVR期间,我们首先增强表达集X_exp的语义信息(红色箭头),然后迭代地削弱抑制集X_sup的语义(蓝色箭头)。(c):在IPCA中,我们将 K_tilde 与 K_bar 连接,将 V_tilde 与 V_bar 连接,以提高身份一致性。

(左):1Prompt1Story 可以与 ControlNet 集成,以实现空间控制,从而实现一致的角色生成。(右):此外,我们的方法还可以与其他方法(例如 PhotoMaker)结合使用,以实现真实图像个性化,同时提高身份一致性。

结果展示

现有方法(上)在 T2I 生成一致性方面面临挑战。SDXL 和 Juggernaut-X-v10 等 T2I 模型在生成的图像之间经常表现出明显的身份不一致。尽管包括 IP-Adapter 和 ConsiStory 在内的最新方法已经提高了身份一致性,但它们失去了生成的图像与相应输入提示之间的一致性。我们方法的其他结果(下)展示了卓越的一致性,同时不损害文本和图像之间的一致性。

对帧提示顺序的鲁棒性。使用同一组帧提示但不同的顺序,我们的方法 1Prompt1Story 可以一致地生成具有统一标识的图像。

多主题故事生成。通过在身份提示中定义多个主题,我们的方法生成具有多个角色的图像,每个图像都保持良好的身份一致性。

种子变化。通过使用不同的种子,1Prompt1Story 可以生成具有不同背景的图像,同时保持一致的身份。

与不同的基础模型相结合。

相关文章:

  • 掌握Linux基础:从文件链接到Shell命令的全面指南
  • CTF杂项——[WUSTCTF 2020]alison_likes_jojo
  • React:类组件(上)
  • 开发、科研、日常办公工具汇总(持续更新)
  • matlab常见的配图代码实现1
  • SpringBatch之ResultSet.next()
  • PythonWeb开发框架—Flask框架之flask-sqlalchemy、序列化和反序列化使用详解
  • MySQL环境搭建和基本操作
  • 从1G到6G的多址接入技术详解
  • ARM嵌入式低功耗高安全:工业瘦客户机的智慧城市解决方案
  • 字符串相乘——力扣
  • Java 大视界 -- Java 大数据在智能体育赛事运动员表现分析与训练优化中的应用(122)
  • Python实例:PyMuPDF实现PDF翻译,英文翻译为中文,并按段落创建中文PDF
  • 环形链表问题的探究与代码实现
  • 【网络安全 | 漏洞挖掘】通过JWT的IDOR实现账户接管
  • 探索Java多线程的核心概念与实践技巧,带你从入门到精通!
  • 007-Property在C++中的实现与应用
  • Agent范式引领AI革命:Manus如何重塑生产力版图?
  • 【AGI】OpenManus 技术全景解析
  • ResultMap
  • 又是“9+2”复式票,浦东退休阿姨擒大乐透1153万头奖
  • 金爵奖主竞赛单元评委名单公布,中国评委有黄渤、咏梅等人
  • 购房成本再降低!今年首次降息落地,30年期百万房贷月供将减少54元
  • 习近平向2025年上海合作组织减贫和可持续发展论坛致贺信
  • 复旦兼职教授高纪凡首秀,勉励学子“看三十年才能看见使命”
  • 周慧芳任上海交通大学医学院附属上海儿童医学中心党委书记