论文 #15: Compositional Diffusion with Guided Search - 阅读报告
论文 #15: Compositional Diffusion with Guided Search - 阅读报告
基本信息
- 标题: Compositional Diffusion with Guided search for Long-Horizon Planning
- 作者: Utkarsh Aashu Mishra, David He, Yongxin Chen, Danfei Xu
- 发表日期: 2026 年 1 月 26 日
- 主要领域: applications to robotics, autonomy, planning
- Submission Number: 23168
关键词
Diffusion Models, Compositional Diffusion, Goal-directed Planning
TL;DR
我们将搜索集成到组合扩散中,将短视距模型扩展为长视距计划,支持运动规划、全景图像合成和长视频生成
摘要
生成模型已成为强大的规划工具,组合方法通过组合在一起局部、模块化生成模型,为建模长视距任务分布提供了特别有希望的方案。
这种组合范式跨越不同领域,从多步操作规划到全景图像合成到长视频生成。
然而,组合生成模型面临一个关键挑战:当局部分布是多模态时,现有组合方法平均不兼容的模式,产生的计划既不是局部可行的也不是全局连贯的。
我们提出了组合扩散与引导搜索(CDGS),它通过在扩散去噪过程中直接嵌入搜索来解决这个模式平均问题。
我们的方法通过基于群体的采样探索局模式的多样组合,使用基于似然的过滤修剪不可行候选,并通过重叠段之间的迭代重采样强制全局一致性。
CDGS 在七个机器人操作任务上匹配 oracle 性能,优于缺乏组合性或需要长视距训练数据的基线。
该方法跨领域泛化,通过有效的局部到全局消息传递实现连贯的文本引导全景图像和长视频。
更多详情:https://cdgsearch.github.io/
核心贡献
- CDGS 方法: 组合扩散与引导搜索
- 模式平均问题解决: 嵌入搜索到扩散去噪过程
- 群体采样: 探索多样模式组合
- 全局一致性: 迭代重采样强制一致性
- 跨领域应用: 机器人操作、全景图像、长视频
研究意义
- 解决了组合生成模型的模式平均问题
- 实现了长视距规划
- 跨领域通用性强
- 对机器人规划和内容生成有重要价值
阅读笔记
- 核心问题是组合多模态局部分布时的模式平均
- 通过在扩散过程中嵌入搜索来解决
- 在机器人操作、图像合成、视频生成上都有应用
- 不需要长视距训练数据是一个优势
- 对于需要长序列生成的任务非常有价值
报告生成时间: 2026-04-13 OpenReview 链接: https://openreview.net/forum?id=b8avf4F2hn