当前位置：首页 > news >正文

论文笔记：Seed: Bridging Sequence and Diffusion Models for RoadTrajectory Generation

news 2025/11/7 7:15:28

WWW 2025

1 INTRO

随着 GPS 设备的普及，车辆和个体的移动轨迹可以轻松被记录为轨迹数据
- 大量的轨迹数据促进了许多重要应用的发展，例如城市交通规划、车辆导航和路径推荐
- 然而，获取真实世界的轨迹数据面临多种挑战，包括高昂的数据采集成本、隐私问题，以及商业限制
- 轨迹生成技术通过基于参考轨迹数据集生成合成但真实感强的轨迹，从而成为应对上述挑战的有效方案
为了服务下游任务，合成轨迹需具备以下特性：
- 应与参考轨迹相似（即一致性）、遵循轨迹运动规律]，并且在生成的多个轨迹之间具有差异性（即多样性）
现有轨迹生成方法根据方法论可分为两类：
- 递归式方法（Recurrent）
  - 使用序列模型（ LSTM 和 Transformer）以自回归的方式逐段生成轨迹（即一次一个道路段）
    - SeqGAN 结合了 LSTM 和生成对抗网络（GAN），并使用策略梯度算法进行训练。
    - TrajVAE 利用 LSTM 和变分自编码器（VAE）学习轨迹表示并重构轨迹。
    - TS-TrajGen 则结合 Transformer 和两个 GAN，以由粗到细的粒度生成每条轨迹。
- 整体式方法（Holistic）
  - 一次性生成完整的轨迹
    - TrajGAN使用基于卷积神经网络（CNN）的 GAN 生成虚拟的轨迹图像，再将其转化为轨迹
    - 为了利用扩散模型,DiffTraj和Diff-RNTraj将扩散模型分别集成到 U-Net [31] 和 WaveNet [18] 中进行轨迹生成。

递归方法在一致性和规律性方面表现出色，这是因为序列模型擅长捕捉参考轨迹沿道路段的运动模式
- 然而，它们的多样性较差，因为生成的轨迹常常严格遵循同一运动模式，导致生成轨迹相似
相反地，那些基于扩散模型的整体式方法具有较高的多样性，但一致性和规律性较弱
- 这是因为扩散模型是从随机噪声中恢复轨迹，不同运行中生成的轨迹往往不同，但它们无法很好地捕捉沿道路段的顺序移动模式

——>论文提出了一种名为 Seed 的轨迹生成方法，目标是同时实现一致性、规律性和多样性
- 核心思想是联合使用序列模型和扩散模型，兼顾两者优点，同时避免其缺陷

2 问题定义

2.1 道路网络

2.2 道路轨迹

2.3 轨迹生成

3方法

Seed 包含三个主要组件：

一个道路段嵌入字典模块，用于将离散的道路轨迹转换为连续表示；
一个条件扩散模块，用于学习轨迹数据的分布，并以自回归方式生成道路轨迹；
一个课程学习模块，用于加速模型收敛并提升模型性能。

3.1 道路段嵌入

一种简单的方法是使用一个随机道路段嵌入字典
- 每个轨迹中的道路段均从该字典中提取
- 然而，这种方法忽略了道路网络的拓扑结构以及用户的出行模式
——>论文提出一种预训练策略，旨在学习一个更有效的道路段嵌入字典

3.2 条件扩散结构

3.2.1 扩散模型预备知识

与标准扩散模型不同，标准模型处理的是整个轨迹表示，而本工作将扩散应用于每个道路段嵌入，并以自回归方式逐段生成轨迹，从而在保持序列性基础上提升生成多样性。扩散模型主要包括正向扩散过程与反向去噪过程

3.2.2 引导条件

3.2.3 离散化与空间偏置

4.3 模型训练

4.4 课程学习

4.5 采样（Sampling）

需要在采样开始时指定要生成多少个道路段（比如 20 个），每步生成一个，生成满就停止。

5 实验

5.1 实验设置

5.1.1 数据集

在三个广泛使用的真实世界数据集上评估 Seed 的性能，分别为：Porto¹、Shenzhen² 和 Chengdu³
在每个数据集中，随机选取 80% 的轨迹作为训练集，剩余 20% 作为测试集

5.1.2 衡量指标

5.2主要结果

5.2.1 有效性分析

5.2.2 地理可视化分析

5.2.3 ablation study

http://www.dtcms.com/a/289625.html

相关文章：

LLM指纹底层技术——KV缓存压缩

嵌入式通信DQ单总线协议及UART（一）

是否可以将“进化”应用到软件系统的设计中?

049_List接口（ArrayList / LinkedList / Vector）

Three.js + WebGL 深空星波粒子动画特效制作详解

30天打牢数模基础-模拟退火算法讲解

零基础100天CNN实战计划：用Python从入门到图像识别高手

k8s:离线添加集群节点

Java中的ScopeValue 使用详解

深入解析业务代表模式：解耦表示层与业务层的利器

列空间与零空间，秩—零化度定理

( LeetCode 面试经典 150 题 ) 202. 快乐数（快慢指针）

[simdjson] `error_code` | .get() | 异常 | is_fatal() | current_location() | 链式处理

限流算法与实现

MySQL锁(一) 概述与分类

CMSIS-RTOS线程创建osThreadNew

JAVA国际版任务悬赏+接单系统源码支持IOS+Android+H5

代码随想录算法训练营二十一天|回溯part03

IDEA使用技巧

c/c++-memory-management

ansible awx自动化工具学习准备

牛客-两个链表的第一个公共节点

安全信息与事件管理（SIEM）系统架构设计

TypeScript 中替代 Interface 的方案

PLC（可编程逻辑控制器，Programmable Logic Controller）是什么？

详解如何解决Mysql主从复制延迟

脚本代码：网页限制解除(改)

树同构（Tree Isomorphism）

生成模型与判别模型

虚拟机VMware安装国产桌面系统统信UOS