Interleaving-Reasoning-Generation - 交错推理生成技术
文章目录
- 一、关于项目
- 1、项目概览
- 2、相关链接资源
- 3、功能特性
- 二、性能表现
- 三、安装配置
- 四、使用示例
- 1、推理流程
- 2、案例对比
- 五、更新日志
- 其它
- 参考项目
一、关于项目
1、项目概览
官方实现库:"Interleaving Reasoning for Better Text-to-Image Generation"论文的代码仓库,通过交错推理技术显著提升文生图质量。
2、相关链接资源
- Github:https://github.com/Osilly/Interleaving-Reasoning-Generation
- 论文:https://arxiv.org/abs/2509.06945
- 数据集:https://huggingface.co/datasets/Osilly/IRG-Toy-Dataset
- SFT训练代码:https://github.com/Osilly/Interleaving-Reasoning-Generation/tree/main/SFT
- 评估代码:https://github.com/Osilly/Interleaving-Reasoning-Generation/blob/main/eval/README.md
3、功能特性
-
多阶段推理生成
模型首先生成基于文本的推理过程,然后基于该推理生成图像,再通过反思过程优化图像质量 -
六种分解学习模式
训练流程包含文本思考过程和完整的高质量图像生成流程学习 -
专用CFG条件设计
推理阶段采用特制的CFG条件机制优化图像生成步骤
二、性能表现
模型 | GenEval | WISE | TIIF-short/long (Qwen) | GenAI-Bench | OneIG-EN |
---|---|---|---|---|---|
IRG (Ours) | 0.85 | 0.77 | 76.00/73.77 | 0.84 | 0.415 |
三、安装配置
git clone https://github.com/Osilly/Interleaving-Reasoning-Generation.git
cd Interleaving-Reasoning-Generation
pip install -e .
pip install flash-attn --no-build-isolation
四、使用示例
1、推理流程
2、案例对比
https://github.com/Osilly/Interleaving-Reasoning-Generation/raw/main/figs/compare.png
五、更新日志
- [2025/09/15] 发布[SFT训练代码]和[IRG-Toy-Dataset]
- [2025/09/08] 论文上线arXiv
其它
参考项目
- BAGEL
伊织 xAI 2025-09-15(一)