当前位置：首页 > news >正文

论文阅读12——基于学习的具有扩散行为的人流量预测方法

news 2025/10/25 9:08:35

原文地址：

https://www.sciencedirect.com/science/article/pii/S0968090X25002475?dgcid=SSRN_redirect_SD&ssrnid=5036939

论文翻译：

基于学习的具有扩散行为的人流量预测方法

A learning based pedestrian flow prediction approach with diffusion behavior

摘要：

在城市中心、火车站、机场、购物中心和多模式枢纽等公共场所，准确预测行人流量对于有效的人群管理至关重要，例如：拥堵预防和疏散规划。传统的微观模拟模型通过单独模拟每个行人来提供细粒度的见解，但它们是计算密集型的，通常用于规划和设计阶段，因此不适合高需求场景中的实时干预。另一方面，宏观模型通过聚合行人行为和求解偏微分方程来降低计算成本，但它们通常需要估计交通状态，如密度和速度-在实践中难以准确测量的量。此外，随着这些基于物理的模型的复杂性的增加，其实时使用的计算可行性变得更加有限。数据驱动（机器学习）模型提供了一种计算高效的替代方案，增强了实时预测能力。然而，它们通常需要大型历史数据集才能很好地概括，并且它们的性能在非分发（OOD）条件下可能会下降。此外，大多数黑匣子学习模型缺乏可解释性和特定领域的见解，限制了它们的实际采用。本文基于人群扩散理论，提出了一种新颖的行人流量预测模型。我们的方法直接根据传感器观测数据估计流量，并推断出起点-目的地（OD）需求和路线选择概率，以支持实时操作。为了应对OOD挑战，我们引入了一种在线学习机制，该机制可以根据输入的观察结果持续校准模型参数。

关键词：实时客流预测，行人模拟，可解释的基于学习的方法，人群扩散，在线学习

1. 介绍

预测和估计公共场所的行人移动使运营商能够预测人们将去哪里以及在任何特定时间将有多少人在场。这些信息对于防止过度拥挤和提高疏散效率至关重要。现有的研究主要属于描述性或观察性领域，重点是通过实验或基于物理的微观模拟模型评估、探索或预测疏散行为（Haghani，2020; Rasouli，2021; Helbing和Molnar，1995; Geraerts，2010）。然而，这些模型通常不是为了在操作期间动态更新而设计的，从而限制了它们对实时人群管理的适用性。因此，它们不足以预测和减轻快速变化的场景中与人群相关的风险。

数据驱动模型可用于实时预测，因为它们是根据历史数据预先训练的，以学习复杂的行人活动模式。这使他们能够仅根据当前信息做出预测，使该过程的计算效率更高，并且能够响应实时情况。人们对应用深度学习技术预测流量的兴趣越来越大，例如火车站的进出乘客（Liu等人，2019）或地铁网络中的需求预测（Fang等人，2019）。为了预测行人流量，这些模型依赖于外部因素，例如天气条件、附近车站的流量数据以及每日或每周的活动模式，这通常使预测范围超过15分钟。然而，在大型基础设施或城市中心等开放区域，需要预测密集的人群流动。疏散或娱乐聚会等活动期间。在这里，需要对不久的将来进行预测--通常在几分钟甚至几秒钟内，以有效地实时引导和管理人群。

一些研究分析了行人流量数据来估计火车站的出发地-目的地（OD）需求（Jia et al，2024; Hänseler et al，2017），但这些研究并不是为了预测实时行人交通状态而设计的。在Bamaqa等人（2022）中，使用基于代理的模拟生成合成人群数据集，用于预测人群严重程度。模拟输出包括特工的位置、速度和航向，对其进行处理以获得人群密度、速度和航向方向，作为预测模型的输入。同样，Makinoshima和Oishi（2022）采用粒子过滤模拟方法进行实时人群状态预测，使用观察数据来估计潜在参数。虽然这两项研究都利用模拟工具进行人群分析和预测，但它们仅限于小型室内区域，并依赖于详细数据，例如特工速度、密度和精确位置--这些信息在现实世界场景中很难获得。其他方法，包括用于个人行人轨迹预测的基于计算机视觉的方法（Zheng，2015; Karamouzas等人，2018; Korbmacher和Tordeux，2022），专注于有限空间内的短期微观轨迹预测，这不适用于更大环境中的宏观预测。

目前，大型公共基础设施中明显缺乏有效的数据驱动（机器学习）模型来预测宏观行人流量。这一差距源于现有方法中的两个关键限制。首先，这些模型需要大量的历史数据集来捕捉广泛的条件，包括常规和紧急情况。然而，此类数据很难获得Manibardo et al（2022）、Li et al（2022），因为行人流量高度非平稳--在几秒钟内迅速变化，而且人群动态往往不会重复。因此，数据驱动模型必须频繁重新训练或更新，这对计算要求很高，并且削弱了其实时预测的实用性，尤其是在关键事件期间（Seedat等人，2022）。

其次，大多数现有的深度学习模型都充当黑匣子，缺乏物理原理或可解释结构的集成。这使得从业者难以理解和信任他们的预测，从而降低了他们在运营环境中的适用性。此外，它们复杂的架构很难校准，进一步限制了它们在高风险实时决策环境中的可用性。

在本文中，我们开发了一个数据驱动的行人流量预测框架，该框架基于Liu等人（2015）提出的基本人群扩散模型。我们的模型由两个主要部分组成：路线速度模型（估计行人流速）和路线选择模型（估计行人选择特定路线的可能性）。通过利用这些组件，我们可以预测基础设施中任何两个可访问位置之间的行人流量，并估计起点-目的地（OD）矩阵，同时保持预测过程的可解释性。此外，我们集成在线机器学习技术来处理非静态场景，使模型能够适应新情况。

总而言之，我们的贡献如下。

我们使用图论制定了室内环境/大型公共区域中的行人流量预测问题，并提出了一个轻量级的，交通知识注入的数据驱动模型，该模型利用扩散行为理论进行流量预测。据我们所知，这种方法尚未被探索用于实时人群流量预测。
我们设计了基于学习的路径速度估计模块和路径选择模块来估计扩散行为模型的参数。这些模块共同使我们的预测模型不仅能够预测流量，还能够估计传感器之间的交通状况，即使数据不完整。
我们提出了一个在线学习框架，该框架可适应通用数据驱动方法，以解决分发外（OOD）问题。实验证明了这个在线学习框架的有效性。
为了评估我们模型的性能，我们开发了三个全面的合成数据集和一个现实世界数据集，涵盖公共区域可能发生的各种场景。实验结果表明，我们的模型的预测准确性与传统的数据驱动模型相当，有时甚至优于传统的数据驱动模型。此外，该模型还可以捕捉一般的交通现象。

在本文接下来的文章中，我们首先在第2节中阐述了流量预测问题并定义了场景漂移的概念。接下来，我们在第3节中介绍人群扩散模型和扩展的数据驱动人群扩散模型。第4节描述了合成数据集和在线学习的设置。第5节和第7节分析了我们模型的预测性能，并根据估计的速度和OD矩阵评估其可靠性。最后，我们最后讨论新建模框架的主要发现和潜在增强。

2.问题公式化

在本节中，我们首先制定行人流量预测问题，然后引入场景漂移的概念，指的是前面提到的OOD场景。

图1 传感器网络的图形表示

2.1.流量预测问题的数学定义

本文主要研究大型基础设施或公共空间中的行人流量预测问题。行人流量表示定向人群运动，与速度和密度数据相比，大多数监控系统可以更容易和准确地获取行人流量。它被定义为越过一条线的人数（即，横截面）在一定时期内。假设我们有一个公共区域，如图1（a）所示。每个传感器实时记录人群流量，捕捉流量的即时变化。它们安装在基础设施内的走廊（走廊中的黑色虚线）。尽管穿越线路的行人可以向多个方向移动，但我们在不失一般性的情况下仅为线路传感器定义了两个方向（Tordeux等人，2018; LilasathapornKit等人，2022）：向右流动（蓝色箭头）和向左流动（红色箭头）。

许多研究使用图形来建模道路网络（Han等人，2023）或建筑物或公交终点站等大型基础设施（Løvås，1994; Borgers和Timmermans，1986）来分析交通流。以类似的方式，本文将传感器网络表示为图表（图1（b））。这些传感器将基础设施分为多个部分，每个部分都由传感器界定，以便可以检测到所有进出的行人。传感器之间的距离从20米到100米不等。

形式上，我们将传感器网络定义为有向图，其中= 是传感器节点的集合，是指示从上游节点到下游节点的流动方向的有向边的集合。请注意，图表中的每个节点仅捕获线传感器的单向流，并且如果这些点在基础设施内可访问，则两个节点被连接。

节点的流量受到其上游节点的影响。该流从根节点开始并通过网络传播。我们认为根节点独立于网络中的其他节点，因此仅根据网络内的流量信息而无法预测。例如，我们无法仅根据当前的流量信息预测有多少人会到达大楼。相比之下，具有祖先的节点是相互依赖的，因此是可预测的。因此，流量预测任务可以描述如下：给定历史流量数据其中是时间步上所有传感器的流量的载体𝑘，预测下游节点的未来流量。这里，是滑动窗口的大小，是预测地平线，t是当前时间步。

2.2.场景漂移

行人的移动模式会因意图和条件的变化而变化，例如一天中的不同时间、事件或环境的突然变化。这些变化表现为动态变化的OD需要变化的行人活动路线和动态变化的步行速度。此外，不良事件和中断等意外因素也可能导致重大变化。例如，在火车站，突然的延误可能会改变乘客的移动模式，导致以前未充分利用的地区出现拥堵。传统的离线模型可能无法适应并产生不准确的流量预测。情景漂移是指受这些因素影响的行人流量基本模式和分布的变化。数学定义可以类比为概念漂移问题（Wares et al，2019），它可以定义为：，其中是场景t中行人流量的分布，具有输入变量和地面事实。场景的变化给人群流量预测带来了挑战。

图2 利用上游路线流量预测下游流量的说明。

3.方法

长期以来，气体/流体动力学模型一直被用来通过非线性偏微方程来描述人群流动。这些模型（Henderson和Lyons，1972年; Henderson，1974年）依赖于经典流体动力学理论，该理论假设动量和能量的保守。另一种类型的宏观模型是连续体模型，使用流量、密度和速度等量，以更多的总体术语描述流量动态。它假设在行人流量的任何点都必须满足质量保守方程（Yuan等人，2020）。然而，这些基于物理的模型通常需要强假设并取决于额外的交通状态输入（例如，密度和速度），这在实践中通常很难获得。

在本节中，我们介绍了基本的人群扩散模型，该模型具有几个优点。首先，它具有数据效率，仅需要观察到的流量和平均步行速度。其次，该模型以离散形式制定，使其非常适合时间序列预测任务。第三，模型的简单性可以实现快速计算，这是实时应用程序的一个重要属性。在下文中，我们通过引入路线速度模块和路线选择模块来将该模型扩展到网络层面，以捕捉基础设施位置的时空动态。

3.1. 具有路径选择概率的扩散行为

人群扩散模型是Liu等人（2015）开发的宏观模拟模型，旨在研究行人单向运动。该模型可以描述下游和上游传感器的流量之间的关系，因为它以几何分布离散化了两个传感器之间的行进时间和行走速度，以模拟扩散行为。因此，可以使用扩散过程利用来自上游节点的历史流量数据来估计下游传感器的流量。这个扩散过程本质上是一个上游传感器和一个下游传感器之间流量的单向关系。为了使用历史上游传感器流量估计下游传感器的流量，可用以下公式描述：

由方程式(1)，j是当前时间步，F是扩散系数，是传感器A和B之间的最小传播时间。为了离散化旅行时间，我们将其除以时间单位，在我们的情况下是10秒。

我们现在考虑对行人的路线选择进行建模。从A到B的转移概率被定义为，其中U表示上游节点，D表示下游节点。然后将此概率纳入模型中，使其适用于网络：

最后，传感器B在时间步j的总流量是转移概率与上游流量之间的加权和：，其中是预测下游传感器B的上游传感器的集合。图2展示了利用上游路线流量预测下游流量的过程。在3.3节中，我们将介绍如何估计路线选择概率和路线旅行时间。

3.2.多步预测

当量(1)描述了一步预测的计算。从理论上讲，我们可以通过方程（3）迭代计算中的流量来预测未来的步进行人流量：

因此，在网络层面，我们可以计算具有转移概率的链路上的多步预测：

因此，下游传感器的提前预测是来自其上游的所有预测流量的聚合：

在实践中，每个上游传感器和下游传感器之间的传播时间是不同的，如果我们直接聚集上游流量来预测下游流量，则期望的下游预测地平线被限制在上游预测地平线的最小上界（即。为了解决这个问题，我们用其平均历史流量来估算上游传感器流量数据。例如，如果，但上游传感器仅提供个步骤，则我们用来自节点RST的平均历史流量填充剩余步骤和。这是一种简单且计算高效的对齐预测视野的方法。从经验上看，所需的插补长度通常很短（1至3步），如果上游传感器到下游传感器的传播时间差异不是显着大，那么历史平均在短时间范围内仍然可以准确。

3.3.参数化速度和路线选择概率

行人的行走速度和路线状况是动态变化的，因此扩散系数和转移概率需要参数化为函数。在单向模型中，扩散系数被定义为最小旅行时间的函数，可以表示为：

其中，，是行人的最大步行速度，是传感器之间的距离，而和是控制扩散系数和平均行驶时间的两个校准参数，在我们的模型中，它们被组合并由可学习的参数表示。在步行网络中，路段适应双向流动，因此行人的步行速度取决于同向和反向流动。每条网络链路上的不同别名用于表示链路上的唯一路由条件。最后，路线A到B的扩散系数的计算为：。

在实践中，平均速度并不是固定的，并且会随着行人类型或整体场景的变化而变化。根据基本图，我们将路线速度参数化为上游1流量和下游流量的函数：

在这里，代表可学习的参数，并且可以使用各种数据驱动方法（例如神经网络或决策回归树）对该函数进行建模。在这项研究中，我们选择神经网络是因为它们更适合不同的输入数据格式，并且可以有效地集成到我们的在线学习框架中。

至于转移概率，我们知道它应该是上游节点流量和下游节点流量之间的函数。传感器之间的行驶时间也可能影响行人的选择。因此，转移概率可以通过数据驱动模型进行参数化，并通过softmax函数进行计算，其中作为输入：

这里，是估计上游和下游之间依赖性的评分函数。是传感器u的下游传感器集。是传感器u和d之间的传播时间。

3.4.路线流量预测范式

我们的框架使用两个神经网络来参数化方程。(7)和（8）。本节概述了完整的预测框架。图3说明了我们的数据驱动扩散行为模型的工作流程，该模型由三个独立的部分组成：路线速度预测、路线选择概率估计和路线流量预测层。在路线速度预测模块中，目标是估计边缘上的速度（路线由边缘表示）。来自上游和下游传感器的流量数据由两个多层感知器（MLP）编码。产生的嵌入被反馈到线性层，使用Sigmoid函数简化为纯量。尽管我们尝试了调整倒数第二层的输出维度，但我们发现二维嵌入在经验上表现良好。此外，每个维度都可以被解释为估计的上游速度和下游速度，增强了最终输出的可解释性。相应的计算如下：

在上面的等式中，b是指线性层中的可学习偏差。最终预测的路线速度是使用两个可学习参数的的加权和。为了确保输出为正，我们使用softplus函数来转换预测：

图3。路线流量预测范式。表示时间步𝑡的行人流量。路线分数使用计算。然后使用这些分数来估计路线选择概率，如等式（14）中所述。

受Velickovic等人（2017）工作的启发，路线选择模块通过对重要性分数进行标准化，计算节点的路线选择概率，该重要性分数是其每个下游节点的的输出。首先，来自所有传感器的流量数据由具有可训练参数W的MLP编码。然后，下游和上游传感器的嵌入被级联并输入到完全连接的层中以计算分数。LeakyReLU函数用于引入非线性。它是ReLU函数的扩展版本，当输入为负时允许小的非零梯度，从而防止梯度消失问题。因此，方程(8)中的转移概率通过以下公式估算：

这里，表示上游传感器和下游传感器的嵌入。是最终线性层中的可学习参数，用于学习上游、下游嵌入和传播时间的相关性。是级联操作符，我们使用嵌入和上游和下游传感器之间的传播时间的级联作为softmax函数的输入。

获得路径选择概率和路径速度后，即可通过方程（6）计算扩散系数。在Paradigm的最后一层，Eq. (4)用于进行多步流量预测。

3.5.在线学习人群流量预测框架

在传统的机器学习中，假设未来数据遵循相同的分布，使用固定的历史数据集离线训练模型。然而，在现实世界的人群动态中，由于乘客构成、一天中的时间和意外事件等因素，OD需求和步行行为会随着时间的推移而变化。这些动态且通常不重复的模式使得静态模型难以概括，特别是在罕见或极端场景下。

为了解决这个问题，我们采用了一个在线学习框架，该框架不断调整模型以适应流媒体输入。在线学习是一种典型的机器学习范式，旨在做出随着时间推移不断演变的流媒体决策（Wares等人，2019）。研究的重点是开发快速适应的算法来处理数据分布漂移问题。在线梯度下降（OVD）算法（Hoi等人，2021）是解决在线凸优化问题的一种简单而有效的方法。更先进的方法包括具有自适应滑动窗口的基于树的模型（Domingos和Hulten，2000）和在线顺序极端学习机（Os-ELM）（Liang等人，2006），这是一种基于神经网络的时间序列预测方法。然而，这些方法与特定的模型架构（例如Hoeffding树或单层前向神经网络）相关，因此与我们的面向交通知识的行人流量预测模型不兼容。

我们选择OGD来训练我们的模型。首先，它是模型不可知的，允许与我们定制设计的、充满交通知识的预测模型集成，而不需要结构性更改。其次，OGD非常适合非静态环境：使用保留最近和新到达数据的缓冲数据集（Hoi等人，2021），模型可以通过缓冲区上的随机梯度下降增量更新其参数，而无需对完整的离线数据集从头开始重新训练。这使得能够实时快速适应不断变化的行人流模式。

为了评估模型的性能，我们使用测试然后训练Wares等人（2019）的评估框架。在这种方法中，在对当前数据块进行训练之前，对模型进行评估。测试结束后，大块数据即可用于训练。算法1中描述了评估过程。在开始先测试后训练程序之前，模型需要在正常条件下从典型场景收集的离线数据上进行训练，以建立在线学习的基线。然后，可以使用该框架连续重新训练该模型，以适应不断变化的条件。

4.实验设计

通过一组模拟实验，我们的目标是从三个方面测试我们的新预测模型：正常条件下准确预测的能力、紧急疏散等不利条件下对下游作业的有效性以及路线速度模型和路线选择模型的可靠性。

具体来说，我们通过将模型与基线方法进行比较计算预测准确率，验证速度模型是否能够学习速度与流量之间的基本关系，以及概率模型是否能够准确估计OD矩阵。下面我们更详细地描述了模拟实验的实验设计。首先，简要介绍场景开发。相应地，介绍了合成数据集和现实世界数据集的特征。

4.1.数据集开发和场景

目前，还没有公开可用的人群流数据集既结合了高需求又结合了大型传感器网络（10个或更多传感器）。为了彻底评估我们的模型，我们使用模拟和现实世界的数据开发了一组全面的测试用例。我们使用模拟工具Pedestrian Dynamics（Dynamics，2024）和Nomad（Sparnaaaj等人，2023）构建了三个基础设施，这两个工具都是基于微观代理的模拟平台。图4显示了三个设计基础设施的架构计划，以下小节描述了我们如何设置模拟以为每个基础设施开发不同的场景。这三个数据集专为不同的目的设计，具有不同的空间尺度。Maze和CrossRoad数据集主要改变OD需求和活动模式，而TrainStation数据集旨在模拟火车到达和紧急疏散高峰期间火车站更真实且非常复杂的需求变化。此外，我们还包括在爱丁堡大学信息学学院主楼中收集的现实世界数据集。该数据集包含行人轨迹数据，用于评估模型在实际环境中的预测性能。四个数据集的参数总结见表1。

图4。三个基础设施的架构平面图，由摄像头图标标记的传感器位置以及三个基础设施的传感器网络布局结构。

表1。三个模拟环境的参数。平均流量是根据每个传感器的平均流量计算的。起点数量代表人们可以到达的地点数量。

4.1.1 交叉路口

交叉路口是最基本的基础设施。我们使用模拟器𝑒𝑑𝑒𝑠𝑡𝑟𝑖𝑎𝑛𝐷𝑦𝑛𝑎𝑚𝑖𝑐开发此模拟。交叉路口基础设施中有四个入口和出口，形成一个简单的十字路口，可以从多个方向上观察到行人流量。行人从四个入口之一进入大楼，并选择出口的可能性各不相同。行人的行走速度遵循，表明行走速度最低为0.8 m/s，最高为1.75 m/s，模式为1.35 m/s。每个入口的流量范围为1至8（每人/10秒）。

4.1.2.迷宫

迷宫是基础设施的更复杂版本，由多个相互连接的走廊和十字路口组成。这种设计允许更复杂的路线和交互。该模拟是使用模拟器𝑁𝑜𝑚𝑎𝑑构建的。

每个入口的流量范围为0至3（每人/10秒）。为了模拟需求的变化，该流速会随着时间的推移而变化。行人步行速度服从正态分布，平均值为1.5 m/s，标准差为0.6 m/s。为了防止出现极端速度，速度的界限为最小0.2 m/s，最大1.6 m/s。

4.1.3.火车站

rainStation基础设施模拟现实世界的交通枢纽，具有多个平台、售票区和入口/出口。该模拟基于Pedestrian Dynamics开发。

在每种情况下，代理生成器都会在每个时间间隔生成一组人。该组中的人数遵循均匀分布U（2，5），这意味着该组中将有2至5人。时间间隔是遵循指数分布的随机变量，因此乘客群体的到达遵循Poisson分布。我们将高峰时段的平均间隔s= 2，这意味着平均每2秒就会有一组乘客到达车站。对于非高峰时段，我们设置s= 4。每条火车线路的需求由乘客乘坐该线路的可能性来描述。我们将特定火车线路的需求水平分为高、正常和低。例如，1号线的需求分布为：高：[52%，16%，16%，16%]，正常：[25%，25%，25%]，低：[10%，30%，30%，30%]。

4.1.4.爱丁堡信息学论坛

我们采用了一个现实世界的数据集进行评估。该数据集（Majecka，2009）包括检测到的穿过爱丁堡大学信息学学院主楼信息学论坛的行人目标。这些数据是在几个月内收集的，每个工作日包含约1，000条观察到的轨迹。我们提取并处理了12天的轨迹数据为流量数据。传感器位置在图5的左侧可视化。论坛周围有多个入口/出口点，每个入口/出口点都由传感器监控。

平均步行速度约为1.2 m/s，标准差为1.72;然而，由于距离很短的轨道有噪音，无法确定精确的最大速度。此外，与合成数据集相比，这个现实世界的数据集相对稀疏，平均流量为每10秒0.13个行人。

4.2.实验设置

本节介绍时空流数据的格式、基准模型以及我们用于实验的评估指标。我们创建的数据集以及我们的基准模型的代码可以在此 github 存储库中找到。

表 2 综合数据集上在线人群流量预测的性能，以每 10 秒的行人数 (peds/10 s) 为单位进行测量。红色值表示最低的预测误差，而蓝色值表示第二低的预测误差。

4.2.1.时间序列流量数据

输入数据是一个三维矩阵，表示具有 𝑁 样本，传感器和 𝑀′ 时间滞后的行人流序列。时间窗口𝑀′的长度应谨慎选择：太长的窗口可能包含不相关的信息，而短于传感器之间的最小行进时间的窗口可能无法捕获相关的上游影响，因为在理论条件下（自由流和相同的行走速度），时间𝑡时的下游流入对应于时间时的上游流出。因此，使用短于的时间窗口可能会导致数据中丢失关键因果关系。

在上面，我们将窗口大小设置为6，这意味着我们使用前1分钟的流量数据作为输入来预测每个下游传感器未来1分钟的流量。通过将行人的平均行进时间除以平均行走速度来估计两个线传感器之间的距离。

我们通过改变步行速度、OD 需求和活动模式等参数来生成不同的场景。然后将这些场景连接起来，创建四个用于在线测试的综合数据集。此设置还使我们能够模拟连续数据流中的场景漂移。

4.2.2.基准模型

由于目前还没有专门针对公共场所人群流量预测设计的模型，因此我们选择了几种现成的数据驱动模型进行比较。由于模型将在线训练和测试，因此优选具有较少可训练参数的相对较小的模型。我们选择传统的时间序列预测模型，例如LSTM（长短期记忆）、非参数方法和移动平均（MA）。它是一种简单而有效的估计人群流量的方法，并且仍然常用于一些火车站人群流量预测系统。我们还包括 GAT（图注意力网络）（Velickovic 等人，2017 年）、GCN（图卷积网络）（Kipf 和 Welling，2017 年）等图模型，以及时空模型 GCN-LSTM。请注意，所有基线模型均按照算法 1 中所述进行在线训练。

4.2.3.模型评价方法

我们使用平均绝对误差（MAE）和均方根误差（RMSE）来计算预测误差，由于模型以在线方式输出预测，因此我们计算所有数据流块的 MAE 和 RMSE 进行比较。以下方程计算预测和地面实况之间的 MAE 和 RMSE。

我们通过比较 RMSE 和 MAE 来评估模型的预测准确性。目标不是实现最先进的预测精度，而是获得与其他众所周知的数据驱动模型相当的性能。现有方法的预测精度已经足以满足大多数场景。

定期收集数据流，每 10 秒记录一次流量数据。我们将模型更新频率设置为 5 分钟，这意味着每 30 个数据点后模型会重新训练一次。重播缓冲区大小不应该太大，因为它在实践中占用大量存储空间。然而，它也不应该太小，因为需要足够的空间来让模型在以前的场景中重新训练。我们根据经验将其设置为 1000，允许它存储来自三个最近场景的数据，每个场景包含大约 360 个数据点。

5. 在线预测性能

在这四个数据集中，𝐶𝑟𝑜𝑠𝑠𝑅𝑜𝑎𝑑和𝑀𝑎𝑧𝑒数据集主要评估模型对行人活动模式变化的鲁棒性，而𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛数据集评估它们对流量突然变化的鲁棒性。数据集 𝐸𝐼𝐹 𝑃 𝐷 测试模型在现实场景中的性能。本节首先比较每个模型的在线预测误差，然后通过可视化预测和真实情况来分析结果。

图 6. 四个数据集的预测误差 (RMSE) 曲线。垂直的红色虚线表示场景的转变。基线模型误差通常会在场景变化后增加，而扩散模型则表现出更高的稳定性。

5.1.预测误差分析

我们比较了前三个数据集中提前 1 分钟多步预测的质量和现实数据集中提前 10 秒的预测的质量。结果如表2所示。MA在𝐶𝑟𝑜𝑠𝑠𝑅𝑜𝑎𝑑和𝑀𝑎𝑧𝑒中表现最好。以下原因可以解释这一结果：（1）两个数据集中的需求逐渐变化，因此每个传感器的流量保持平稳，不会突然下降或增加。在这种情况下，简单的 MA 足以捕捉趋势。 (2)MA没有任何可训练的参数，不需要适应不同的场景。 (3) 在网络中断期间，MA 仍然可以通过平均历史流量来提供稳定的预测，而数据驱动的模型可能会因依赖更广泛的、可能误导性的输入而陷入困境。

在 𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛 数据集中，由于火车到达引起的流量高度波动，MA 模型的性能恶化。相比之下，其他数据驱动模型可以更快地对峰值做出反应，因为它们在之前的训练数据中也遇到过类似的情况。另一个有趣的发现是，基于图的模型的预测精度与 LSTM 相当。我们认为这是因为数据集的图大小不够大，图模型无法具有显着的优势。

就 RMSE 而言，扩散行为模型在 𝑀𝑎𝑧𝑒 和 𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛 中表现第二好。因为它往往会高估拥塞或网络中断期间的流量，从而导致在这些场景中比其他模型具有更高的 RMSE。然而，主要目标不是开发一个在所有场景中预测精度最好的模型，而是设计一个能够获得可接受的精度并快速适应新场景的模型。我们记录了每个数据块的在线预测 RMSE 并将其绘制在图 6 中。为了清晰起见，使用 30 分钟的滑动窗口对预测误差曲线进行平滑。如图所示，扩散行为模型在不同场景下保持一致的预测误差，证明了其对场景漂移的鲁棒性。在图6（d）中，所有模型的表现相当，由于人流的稀疏性，预测误差保持在较小的范围内。

总之，我们的模型利用扩散过程进行行人流量预测。结果表明，其预测准确性可与广泛使用的数据驱动模型相媲美。尽管这些方法在不同的数据集上达到了相似的准确度，但基于扩散的模型可能因其透明且可解释的预测过程而更受青睐。

5.2.预测可视化

我们在图 7 中可视化了传感器 5000 秒的模型预测和地面实况。该图显示了 𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛 走廊中传感器的 40 秒预测。在图7（a）中，扩散行为模型的响应比MA更有效，表现出明显的延迟。图 7(b) 将我们的模型与 LSTM 进行了比较，表明我们的模型更准确地捕获峰值流量，而 LSTM 有时会低估流量并完全错过需求峰值。在图 7(c) 和 (d) 中，我们将我们的模型与基于图的模型进行了比较。 GCN 有效地捕获了峰值流量，但往往会低估它们。另一方面，GAT 准确地捕捉流量模式的周期性上升，但对突然变化的敏感性有限。这些可视化结果表明，扩散模型比其他模型可以更有效地捕获峰值需求。附录 A 中提供了其他位置预测的更多可视化结果。

图 7.模型对 𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛 中一个传感器的 40 秒提前预测。

5.3.作为拥塞检测器的预测模型

在正常情况下（自由流动），一个好的预测模型应该以高精度为目标。然而，在拥堵或中断期间，如果该模型还可以充当预警系统，那将是有益的。我们提出的人群流量预测模型展现了这种潜力。为了说明这一点，我们计算了火车站进出流量随时间变化的总差（入站-出站），如图8（a）所示。进站流量包括下车旅客和进站旅客。该差异中的两个峰值表示出站流量明显滞后于入站流量的时刻，表明登机口和出口之间存在严重拥堵。

该模型对主出口和后出口的 40 秒预测如图 8（b）和图 8（c）所示，我们的模型预测这两个时刻的流量极高，随后迅速下降。然而，实际的下游流量增加得更加缓慢。模型预测与实际流量之间的差异表明，虽然许多人从上游接近，但拥堵减慢了他们的移动速度，延迟了他们到达下游传感器的时间。该模型的高估成为检测拥塞的有用信号，并可以增强实时警报系统和应急响应策略。

5.4.负二项式似然的在线不确定性量化

将不确定性纳入人流预测可以显着改善实时决策。为了评估我们的模型在不确定性量化方面的能力，我们采用参数概率方法，使用负二项分布对行人计数进行建模 - 这是正计数数据的公认选择（Chapados，2014）。这使我们能够将训练过程表述为似然最大化问题。相应的负二项式似然定义如下：

图 8. 严重拥堵时扩散模型预测的可视化。当拥堵严重时，模型会超出预测。垂直的红色虚线表示场景的转变。

在该公式中，𝑦表示人流的一步预测，而𝜇和𝛽是负二项分布的均值和形状参数。在 Salinas 等人 (2020) 的设置中，参数 𝜇 和 𝛽 使用两个独立的神经网络进行估计。具体来说，在我们的方法中，预测分布平均值 (̂𝜇) 的过程与非概率预测相同，但是，我们使用额外的 MLP 来预测传感器的形状参数 ̂𝛽，并使用其上游流作为输入。此外，仅优化负对数似然（NLL）损失函数可能会导致单值预测的准确性较差。因此，为了训练模型，我们将第一步的 NLL 损失与后续步骤的均方误差 (MSE) 损失相结合，形成以下联合目标：

我们使用覆盖概率校准曲线评估分布预测的质量，将我们的模型与在相同损失函数（方程（18））下训练的基准模型（例如 LSTM 和 GCN-LSTM）与数据集 𝑇 𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛 进行比较。此外，我们还引入了 DeepAR（Salinas 等人，2020），一种复杂的概率预测模型，以进行进一步比较。覆盖概率衡量落在预测间隔内的观测数据点的比例。对于校准良好的模型，校准曲线应与标称预测区间（参考线）对齐。如果曲线低于参考线，则模型会低估不确定性，从而产生过窄的预测区间；如果它位于上方，则模型会高估不确定性，导致区间过宽。

从图 9 中可以看出，当拥挤水平低于 40 (peds/10 s) 时，扩散模型与参考线紧密对齐，表明与其他方法相比具有更好的校准效果。随着拥挤程度的增加，替代模型开始低估预测区间，反映出对其预测的过度自信。为了说明这种行为，我们提出了图 10 中概率预测的快照。在此示例中，疏散发生在时间步 955。相应的预测概率质量函数（PMF）显示在图的中心。扩散模型捕获尖峰并预测此时的高度不确定性，而 DeepAR 产生的预测区间要窄得多，几乎无法包含真实的行人流量。

图9.不同拥挤程度下的覆盖概率校准曲线。

作为本节的结论，我们证明我们的模型可以通过将负二项式可能性纳入训练损失来有效捕获预测不确定性。通过这种简单的修改，与基线模型相比，该模型能够实现更好校准的预测区间，特别是在极端或快速变化的人群条件下。此功能增强了模型对实时人群监控和管理的适用性，其中可靠的不确定性估计至关重要。

图 10. 疏散过程中估计的 90% 预测区间和预测概率分布。粉色虚线表示拥挤程度较高的时刻。

6. 在线学习分析

在本节中，我们首先验证预测框架中在线学习的有效性，然后分析OGD对更新频率的敏感性及其实时计算成本。

6.1.再训练的效果

图 11 显示了模型对每个数据块的平均预测 RMSE，比较了有和没有在线再训练的性能。结果清楚地表明，当不采用在线学习时，预测误差会大幅增加（在线再训练步长设置为0)。具体来说，非基于图的模型 LSTM 总体上从在线学习中获益最多，如表 3 所示，预测误差下降的百分比。由于 LSTM 进行预测时不使用图的拓扑信息，因此 OD 需求的变化会显着影响其预测精度。相比之下，基于图的模型表现出更稳健的行为。

表3 在线学习各模型的误差减少百分比。

图 11. 有和没有在线学习的在线预测性能。

图 12. 预测误差随不同更新频率的变化。（无穷大意味着根本没有更新）。

6.2.对更新频率的敏感性

我们进一步研究更新频率对预测准确性的影响。数据流的块大小决定了模型重新训练的频率。如算法1所述，采样一部分块数据作为评估集，如果评估集上的预测误差超过指定阈值，则提前停止重新训练，以防止过拟合。因此，选择合适的块大小至关重要：小块大小可能会导致评估集不可靠，而大块大小会降低更新频率，可能会影响模型的适应能力。

我们在图12中测试了具有不同更新频率的三个模型。一般来说，我们可以观察到，当更新频率设置为每3分钟最高一次（块大小为15）时，模型不一定能达到最佳性能，因为评估集太小而无法提供可靠的反馈。随着更新频率的降低，预测精度逐渐提高。然而，当频率变得太低时，性能开始恶化。在数据集𝑀𝑎𝑧𝑒中，行人的路线选择行为比数据集𝑇𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛中的行人的路线选择行为更加多样化，我们可以看到LSTM的性能随着更新频率的降低而下降，并且与基于图的模型相比更加敏感。扩散模型对更新频率的敏感度最低，表明该模型的结构可以在不同场景下很好地泛化。

6.3.计算成本

在线学习可以通过频繁的再培训来解决数据分布的漂移问题。我们研究了在线学习期间每轮再训练的计算成本。我们模型的前向传递的时间复杂度是两倍。对于路径速度模块，复杂度为，其中𝑇 表示输入时间步数，𝑑𝑣 是隐藏层的维度。在这里，𝑇𝑑𝑣 解释了生成上游和下游流嵌入的复杂性。路线选择估计模块的时间复杂度为，其中 𝑑𝑐 是嵌入大小。这种复杂性说明了每个节点嵌入的生成以及等式 (14)中对于每条边重要性分数的计算。

可变块大小与重新训练计算时间相关，因为模型首先对数据块进行训练，然后对来自重播缓冲区的随机采样的最近存储的数据进行训练。其他变量，例如传感器图大小的增加和模型中可训练参数数量的增加，也会增加算法的空间和时间复杂性。表 4 总结了不同数据集中可训练参数的数量。我们可以看到，传感器的数量不会影响基于图的模型的参数，而在 LSTM 模型中，参数随着传感器数量的增加而大幅增加。对于扩散模型，参数数量随着传感器网络中边数的增加而增加，因为每条边都有一个可训练参数𝛼。然而，这种增量很小，几乎可以忽略不计。一般来说，扩散模型的可训练参数最少。

表4：三个数据集的不同模型的可训练参数数量。

在实践中，模型每 10 秒进行一次预测，并在需要更新时在该时间范围内完成重新训练。图 13 显示了数据流的块大小如何影响重新训练计算时间。实验在配备 Apple M1 Pro CPU、16 GB RAM 和 500 GB SSD 的 MacBook Pro 上进行。在数据集中𝐶𝑟𝑜𝑠𝑠𝑅𝑜𝑎𝑑中，传感器图相对较小；因此，计算时间远低于𝑀𝑎𝑧𝑒和𝑇𝑟𝑎𝑖𝑛𝑆𝑡𝑎𝑡𝑖𝑜𝑛。对于较大的网络，即使块大小为 90（相当于更新频率为 15 分钟），平均重新训练时间仍保持在 5 秒左右，远低于 10 秒阈值。因此，每轮再训练的计算时间是可控的。尽管由 24 个节点和 54 个边组成的最大网络不如城市规模网络那么广泛，但对于大型基础设施来说已经足够了。

图 13.模型每次重新训练的不同块大小的挂钟运行时间。

7. 路径速度和路径选择模型的定性评估

在本节中，我们评估速度模型和路线选择模型的预测质量。为了评估路线选择模型，我们评估了它在不同场景下对 OD 矩阵的预测，并将其与真实 OD 进行比较，因为 OD 可以反映行人的路线选择概率。对于速度模型，我们研究了它对从数据中得出的速度和流量之间关系的理解。

图 14. 估计路线概率随下游流量变化而变化。

图 15. 地面真实 OD 与估计 OD 之间的比较，其中颜色表示过路人数 - 颜色越深代表数字越高。

7.1.基于路径选择模型的OD估计

从模拟器中提取轨迹数据，以生成 𝑀𝑎𝑧𝑒 基础设施的 OD 矩阵。使用这些轨迹数据，我们计算了特定时期内从 A 点移动到 B 点的人数，从而使我们能够提取 OD 矩阵。

在图 14 中，我们关注选定的上游传感器，并可视化其下游路径的估计路径选择概率。结果表明，估计概率通常随着相应下游流量的增加而增加，遵循类似的趋势。在第三张图中，显示了从起点 23 到目的地 16 的估计概率，我们注意到，即使下游流量在第 200 个时间步之后下降，估计概率仍继续上升。发生这种情况是因为模型检测到其他两条下游路线的流量下降幅度更大，使得当前路线相对更有利。这种反应与直觉是一致的：在公共空间中，进入某个位置的行人数量越多，通常表明该路线的吸引力或实用性越大，因此更有可能被其他人选择。

我们在图 15(a) 中展示了具有不同行人活动模式的四种不同场景的地面实况 OD 矩阵，在图 15(b) 中展示了模型的估计。 𝑥 轴代表出发地，𝑦 轴代表目的地。我们观察到仅给出节点传感器信息，模型就可以识别高需求的 OD 对。然而，当行人活动模式高度多样化时，路线选择模型估计的准确性可能会降低。例如，在场景 18 中，地面实况 OD 显示没有从路点 8 到路点 3 的移动。然而，由于同时有人从出口 7 前往航路点 3，因此航路点 3 处的下游传感器仍然检测到有人通过。因此，模型可能假设人们有机会从路径点 8 前往路径点 3。因此，模型可能会推断出从航点 8 到航点 3 的可能路线。由于该模型仅依赖于来自节点传感器的流量数据，因此可以合理地预期准确的地面实况与估计的 OD 流量之间存在一些差异。

图 16. 真实 FD 与估计 FD 之间的比较。

7.2.流量和速度基本图

验证路线速度模型是否能够捕捉速度-速度基本图（FD）的特征。我们通过计算每个时间步的行进距离除以行进时间来确定代理在路线上的行走速度，然后对这些值进行平均以获得路线速度。当前在路线上的人数代表流量。利用这些信息，我们构建了基本图（FD）。在图16（a）中，我们可视化了地面真实速度流FD，而图16（b）显示了预测路线流量和预测路线速度之间的关系。请注意，估计的 FD 和地面实况 FD 数据点并不是一一对应的，因为我们使用预测的路线速度和流量来绘制估计的 FD。这次比较的主要目的是看看我们的模型是否可以学习行人基本图的一般形状并提取不同场景的特征。

图 17. 溢流的演变。蓝色箭头代表上游流向，橙色箭头代表下游流向。

图 18。模型根据上游和下游流量之间的差异来估计速度。

在地面实况基本图中，速度和流量之间的关系与经典交通流理论非常吻合，在速度-流量曲线的下降分支上表现出自由流状态（较高的速度，较低的密度），在速度-流量曲线的上升分支上表现出拥堵状态（较低的速度，较高的密度）。当路线流量接近最大值时，数据点聚集在临界速度附近。在估计的 FD 中观察到类似的模式。然而，预测速度略高于实际速度。这种差异可归因于两个原因：（1）模型估计两个传感器之间的最大行驶速度，（2）有一个参数𝛼来控制预测速度的范围。因此，该模型倾向于预测更高的值。此外，尽管该模型捕捉到低流量条件可以对应于低速和高速，但它并没有完全再现流量-速度关系的拥塞动态。例如，在场景 18 中，groundtruth FD 显示了一组具有高流量和非常低速度的数据点，这表明拥塞。估计的 FD 中没有捕获这种模式，这表明该模型可能无法完全了解拥挤的行人交通的复杂动态。

然而，我们的模型能够反映流量变化时速度的总体变化。我们在图18中研究了估计速度和观测流量之间的关系。图18（a）显示了传感器网络中一个链路的上下游流量以及正常情况下相应的估计速度。该模型了解到，当上游和下游流量存在显着差异时，上游流量远高于下游流量，路线速度应该较低（如图18（a）中的速度下降所示）。这一特性符合一般的物理现象：如果我们将走廊比作管道，将人比作流体，则流入量高于流出量表明流体速度较低，表明连接处可能存在拥堵。

图18（b）显示了高度拥堵走廊中的估计速度，对应于图17中的可视化场景。最初，入口点的需求很高，但人们被困在走廊中，导致下游流量减少。这种拥塞通过上游传感器反向传播，导致上游流量减少。在这种情况下，由于上游流入量高但下游流出量低，预测速度首先下降。该模型随后无法识别拥塞，因为上游和下游流量之间的差异不足以触发模型预测低速度。它也无法检测溢出效应，因为该模型没有明确纳入行人流中的质量守恒原理。由于传感器继续记录行人的运动，因此模型可能会解释行人仍在穿过走廊。然而，它缺乏识别拥塞以及拥塞何时向上游传播并影响前一个节点所需的信息。这一限制解释了为什么该模型无法完全捕获基本图中的拥塞模式。由于缺乏对链路级流量和密度的直接测量，这代表了仅依赖可观测数据和实现更完整的流量动态表示之间的权衡

8. 局限性

本节概述了与本研究中使用的数据和所提出模型的设计相关的局限性。开发合成数据集是为了评估模型在具有不同行人活动模式的高需求场景中的性能。尽管综合模拟可以通过调整模拟参数来生成受控和可重复的场景，但此类数据可能无法完全捕捉现实世界行人行为的复杂性。

另一方面，现实世界的数据可以提供行人动态的真实表示。然而，满足本研究所需的时空粒度的高质量数据集，特别是在大规模公共环境中，仍然有限。尽管我们在实验中包含了真实世界数据集（EIFPD），但其有限的规模和稀疏性降低了其综合模型评估的有效性。这种限制强调了使用合成数据的价值，并强调了在未来工作中开发更丰富、大规模行人数据集的必要性。

关于预测模型，它被设计为可解释并由交通流理论提供信息。它推断中间变量，例如步行速度和路线选择，而不是使用黑盒技术直接拟合观察到的流量。虽然与纯粹的数据驱动方法相比，这种方法限制了模型的灵活性，但它增强了可解释性，并提供了对运营决策有价值的额外交通信息。

另一个限制是该模型无法在拥堵期间进行预测，因为它仅依赖于传感器流量数据，并且不包含传感器位置之间的密度测量。这种设计选择反映了实时密度数据的有限可用性（通常很难获得）与基于可访问输入（例如计数/流量）进行及时预测的实际需要之间的权衡。

9. 结论和未来工作

在本文中，我们提出了一种利用扩散行为理论的基于学习的行人流量预测模型。该模型采用解耦架构来增强透明度。此外，我们将该模型纳入在线学习框架中以解决场景漂移问题。我们的模型可以仅使用传感器流量数据来估计传感器之间的交通状况，作为短期人群状态估计器来支持实时干预。总体而言，本文展示了将人群扩散模型与神经网络相结合，在高度动态的公共环境中进行宏观行人流量预测的潜力，并且比其他现成模型具有更好的鲁棒性。

未来，我们计划探索除了简单的 OGD 之外更先进的在线学习技术，这需要更少的再训练时间。我们可以结合不确定性估计来确定模型更新的最佳时刻。此外，如上一节所述，当仅依赖传感器数据时，速度模型可能无法在拥塞期间做出准确的预测。将来，我们可能会探索在神经网络中设计一个模块来隐式推断传感器之间的密度，例如利用通过上游和下游传感器的累计行人数量信息。这可以提高速度和扩散模型的准确性，特别是在拥挤的条件下。最后，未来工作的一个有希望的方向是将我们的模型集成到实时人群管理或控制算法中，使用其短期预测作为输入。这可以提供近似的交通状态估计，支持更有效的运营决策。

查看全文

http://www.dtcms.com/a/524532.html