精华内容
下载资源
问答
  • 在相空间的滤波交通流预测模型中,并对实际数据进行仿真验证,将单点数据 相空间的滤波预测模型和多点数据融合的相空间滤波预测模型进行性 能对比分析,表明多点数据融合理论在交通流预测中有较好的应用效果。
  • 以北京三环路的一个区间路段作为短时交通流预测的背景,利用实际检测数据将非参数回归预测模型中核函数法和最邻近法2个不同的权函数方法进行了仿真对比研究,结果表明在相同的预测精度下,最邻近法更适合时间间隔比较短...
  • 针对现有交通流预测方法忽视对交通流数据自身特征的有效利用以及不能模拟更复杂的数学运算,提出了一种改进深度置信网络(deep belief network,DBN)的交通流预测方法。该方法结合深度置信网络模型与softmax回归...
  • 对各种交通流预测模型的简要分析

    千次阅读 2021-03-17 20:41:16
    交通流预测在智能交通系统中一直是一个热门的研究领域,几十年来,专家和学者们用各种方法建立了许多相对精确的预测模型。本文在提出交通流短期预测模型应具备的特性的基础上,讨论了几类主要模型的结果和精确度。...

    摘要:随着社会的发展,交通事故、交通堵塞、环境污染和能源消耗等问题日趋严重。多年来,世界各国的城市交通专家提出各种不同的方法,试图缓解交通拥堵问题。交通流预测在智能交通系统中一直是一个热门的研究领域,几十年来,专家和学者们用各种方法建立了许多相对精确的预测模型。本文在提出交通流短期预测模型应具备的特性的基础上,讨论了几类主要模型的结果和精确度。

    关键词:交通流预测;模型;展望

    20世纪80年代,我国公路建设项目交通量预测研究尚处于探索成长阶段,交通量预测主要采用个别推算法,又可分为直接法和间接法。直接法是直接以路段交通量作为研究对象;间接法则是以运输量作为研究对象,最后转换为路段交通量。

    进入90年代后,我国的公路建设项目,特别是高速公路建设项目的交通量分析预测多采用“四阶段”预测,该法以机动车出行起讫点调查为基础,包括交通量的生成、交通分布、交通方式选择和交通量分配四个阶段。

    几十年来,世界各国的专家和学者利用各学科领域的方法开发出了各种预测模型用于短时交通流预测,总结起来,大概可以分为六类模型:基于统计方法的模型、动态交通分配模型、交通仿真模型、非参数回归模型、神经网络模型、基于混沌理论的模型、综合模型等。这些模型各有优缺点,下面分别进行分析与评价。

    一、基于统计方法的模型

    这类模型是用数理统计的方法处理交通历史数据。一般来说统计模型使用历史数据进行预测,它假设未来预测的数据与过去的数据有相同的特性。研究较早的历史平均模型方法简单,但精度较差,虽然可以在一定程度内解决不同时间、不同时段里的交通流变化问题,但静态的预测有其先天性的不足,因为它不能解决非常规和突发的交通状况。线性回归模型方法比较成熟,用于交通流预测,所需的检测设备比较简单,数量较少,而且价格低廉,但缺点也很明显,主要是适用性差、实时性不强,单纯依据预先确定的回归方程,由测得的影响交通流的因素进行预测,只适用于特定路段的特定流量范围,且不能及时修正误差。当实际情况与参数标定时的交通状态相差较远时,预测误差将会增大,而在线标定多元线性回归的参数又比较困难。同时,在将主要影响因素量化的过程中还存在着一些不确定性。

    二、交通仿真模型

    一般来说,交通仿真模型把车辆当作实体,用计算机模拟实际道路交通情况,对道路的交通状况进行仿真,得到道路预测的交通信息。因此,严格意义上说,交通仿真模型不能用于交通流预测的目的,因为它需要输入用于预测的交通流数据。而且,交通仿真模型不能实现实时性。然而,一旦交通流量数据能够通过其他的方法预测得到后,仿真模型可以提供一种估计动态旅行时间的方法。换句话说,仿真模型提供了一个交通流、占有率和旅行时间之间关系的一个模拟实际的计算方法。

    三、基于动态交通分配的模型

    当使用传统的仿真模型时, DTA模型通过采集到的交通流数据和出行者出行选择的行为用于估计随时间变化的网络的状态。DTA模型通常分为以下三种:以数学为基础、以变分方程为基础、以主观控制理论为基础或者以仿真为基础的启发式模型。所有这些方法的共同点是他们都是以传统的静态的交通分配的假设解决随时间变化的动态交通流问题,并且对任何一个网络没有一个方法是通用的方法。

    动态交通分配是按照一定的准则将动态交通需求量合理地分配到路网上,从而得到路段实时交通量的方法,实现降低交通拥挤程度和提高路网运行效率的目的。此类方法目标明确,理论清晰,但也存在以下不足之处:①假设条件苛刻,在实际路网中无法得到相应信息或取得信息的代价昂贵;②某些模型的解释性虽然较好,但无法求解或求解难度大,优化时间长;③过分强调精确的系统最优或用户最优分配结果,加大了模型求解的难度,也不适合在大规模路网上实现应用。

    四、非参数回归模型

    非参数回归模型也叫做多元回归模型,是一种多条路段分析方法,这是对单条路段分析的扩展。所谓单条路段分析是基于以前的本路段和几条相邻路段的交通流量信息对该路段进行交通流量预测。它所应用的场合是:不需要先验知识,只需足够的历史数据。它寻找历史数据中与当前点相似的“近邻”,并用那些“近邻”预测下一个时段的流量。该算法认为系统所有的因素之间的内在联系都蕴涵在历史数据中,因此直接从历史数据中得到信息而不是为历史数据建立一个近似模型。也就是说非参数建模没有将历史数据作平滑处理,因此,在有特殊事件发生时,较适合。

    五、神经网络模型

    神经网络是一种新兴的数学建模方法,它具有识别复杂非线性系统的特性,交通系统是复杂巨系统,因此神经网络比较适合于交通领域应用。它采用典型的“黑箱”式学习模式,很适合交通流预测的应用,它不需要任何经验公式,就能从已有数据中自动的归纳规则,获得这些数据的内在规律,即使不清楚预测问题的内部机理,只要有大量的输入、输出样本,经神经网络“黑箱”内部自动调整后,便可建立良好的输入、输出映射模型。

    但正是由于神经网络的这种“黑箱”式学习模式,所以通过神经网络不能获得容易被人接受的输入/输出关系,而且在训练过程中需要大量的原始数据,数据不足会导致不好的预测结果;训练完成的网络只适合于当前研究路段,当道路条件和交通状况改变时,训练完成的网络将不再适用,也不能用于其他路段,故推广能力差;同时,神经网络的学习算法采用经验风险最小化原理(ERM),不能使期望风险最小化,在理论上存在缺陷。

    六、基于混沌理论的模型

    混沌学是一门新兴学科,混沌理论研究的是非线性动力学系统的混沌。混沌(Chaos)是指一种貌似无规则的运动,指在确定性非线性系统中,不需附加任何随机因素亦可出现类似随机的行为(内在随机性)。混沌的最大特点就在于系统的演化对初始条件十分敏感,也就是著名的“蝴蝶效应”。混沌理论研究的目的是揭示貌似随机的现象背后可能隐藏的简单规律,以求利用这些普遍遵循的共同规律来解决一大类复杂系统的问题。复杂系统所表现的非线性动力学性质,是混沌存在的根源。混沌现象是可以短期预测,而长期不能预测的。对于交通的预测,也表现出了这一点,交通流可以短期预测,但不可长期预测。理论上讲,复杂系统中总是存在着混沌,交通流系统是人的群体参与的开放的复杂巨系统,因此交通中存在着混沌。

    通过上述对各种交通流预测模型的比较和分析,可看出任何一个模型都具有其优势和缺点。没有理论证明哪种模型用于哪种交通状态最好,单个模型有局限性,所以用综合模型进行预测将是交通流预测领域的发展趋势。另外,交通系统本质上是人、车、路综合作用的一个复杂巨系统,是一个开放、远离平衡的系统、是一个具有自组织特性的、“组织”与 “自组织”交互作用贯穿全过程的动态系统;系统内部存在着非线性的相互作用、系统的内部过程具有不可逆性,所以基于非线性系统理论的综合模型用于短期交通流预测将有很广阔的应用前景。

    参考文献:

    [1] 刘静,关伟. 交通流预测方法综述 [J]. 公路交通科技,2004(3):82-85

    [2] 杨兆升. 城市交通流诱导系统理论与模型 [B]. 人民交通出版社,2000

    展开全文
  • 在简要介绍最优组合预测模型基础上,以预测误差平方和最小为准则确定最优组合预 测模型中的权系数,实现交通流预测模型的最优组合,并利用实际数据通过与单一时间序列模型、线性回归模型、 卡尔曼滤波模型及人工神经...
  • 本发明涉及深度学习方法和交通流预测等技术领域,具体涉及一种基于遗传算法优化LSTM神经网络的交通流预测方法。背景技术:短时交通流的预测是交通管理部门采取交通控制和诱导措施的重要依据。通过对短时交通流的预测...

    本发明涉及深度学习方法和交通流预测等技术领域,具体涉及一种基于遗传算法优化LSTM神经网络的交通流预测方法。

    背景技术:

    短时交通流的预测是交通管理部门采取交通控制和诱导措施的重要依据。通过对短时交通流的预测,可以提前调整交通管理控制手段,提高交通运行效率。为了更好反应道路交通运行状态,交通流的短期实时预测是智能交通领域研究重点。交通流数据是时间序列数据,随着机器学习及深度学习的推进,对交通流的预测方法也在不断改善。

    早期交通流的预测是基于传统统计学理论。对于统计模型,Ahmed首次将时间序列模型应用于交通流预测领。Vythoulkas引入卡尔曼滤波的交通量预测,采用线性系统状态方程对整体状态进行最优估计。马尔科夫预测模型利用时间序列转移概率预测未来时间序列的状态,但不适用于长期预测。在机器学习预测方法中,Quek利用模糊神经网络建立了每个路段及整个路网的交通流预测模型,采用模拟测试数据进行验证;Jiang采用动态小波神经网络进行实际交通流预测,邵春福提出采用SVM回归模型的交通状态实时预测。于滨提出了基于时间维度、上游路段、下游路段和时空参数四种状态向量的K近邻模型,研究各参数对预测精度的影响。罗向龙提出采用深度信念网络对数据先进行特征学习提取,再采用顶层SVM模型进行预测[。黄廷辉提出了采用分布式梯度优化决策树筛选特征向量建立DUTP-GBDT模型。

    当前深度学习应用在时间序列数据预测中的范围更加广泛。王祥雪通过对LSTM神经网络精细化调参实现了对城市快速路车速的实时预测。王鑫采用多网格搜索优化参数选取的LSTM模型对飞机故障事件序列进行预测。杨其采用LSTM和ARMA对惯性器件的随机误差进行了误差滤波拟合。

    在交通流预测领域,最流行的方法是采用深度学习中的LSTM神经网络进行预测,但该方法需要对LSTM神经网络的参数进行调整,才能拥有较高的预测精度。目前对于深度学习预测模型参数选取研究多是采用遍历多网格搜索算法、控制变量精细调参,计算开销大。

    技术实现要素:

    本发明的内容就是在解决在交通流预测中,由于大范围参数调优带来的计算开销大,训练时间长、预测性能较差、耗费时间长,无法寻到LSTM神经网络最优参数组合的问题。

    为实现上述目的,本发明的技术方案是:

    一种基于遗传算法优化LSTM神经网络的交通流预测方法,包括如下步骤:

    步骤S1、交通流数据采集,并进行数据归一化预处理,分为训练数据集和测试数据集;

    步骤S2、采用遗传算法优化LSTM神经网络预测模型的各个参数;

    步骤S3、输入遗传算法优化好的参数、训练数据集,进行LSTM神经网络预测模型的迭代优化;

    步骤S4、利用已训练好的LSTM神经网络模型对测试数据集进行预测,并评估模型误差。

    进一步地,所述步骤S1具体为:

    步骤S11、采用高速公路高清卡口检测器在设定的观测点或者路段,在一定时间间隔内对交通流数据进行采集;

    步骤S12、对数据进行归一化,并按照比例划分为训练数据集和测试数据集,其中,原始交通流数据DF={df1,df2,……,dfn},数据归一化方法采用离差标准化方法,公式如下:

    其中,di是归一化后的交通流数据,是交通流数据中最小值,是交通流数据最大值,dfi为待归一化处理的交通流数据。

    进一步地,所述的时间间隔包括5分钟、15分钟、30分钟、60分钟。

    进一步地,所述的按照比例划分为训练数据集和测试数据集具体为:将归一化数据的前87.5%为训练数据集,后12.5%为测试数据集。

    进一步地,所述步骤S2中,所述LSTM神经网络预测模型所需优化的参数包括:LSTM神经网络隐藏层数、时间窗步长、训练次数、遗忘率Dropout,所述遗传算法优化LSTM神经网络的模型是在参数搜索空间里,以预测误差最小为目标函数,进行参数组合寻优。

    进一步地,所述步骤S2中采用遗传算法对LSTM神经网络预测模型涉及到的参数进行优化时,以预测误差最小为目标函数,获取参数搜索空间的最优解,进行参数组合寻优,形成复合GA-LSTM模型,包括步骤:

    步骤S21、种群初始化并解码;

    步骤S22、将LSTM神经网络的均方误差作为适应度函数;

    步骤S23、将解的个体进行选择交叉变异操作;

    步骤S24、若适应度函数目标值达到最优值,则进行下一步;否则返回步骤S23;

    步骤S25、获得适应度函数目标值和最佳参数;

    步骤S26、计算基于最佳参数的预测均方误差;

    步骤S27、终止条件判断,若种群迭代次数满足,则停止计算,此时LSTM网络全局最优参数组合;否则返回步骤S26。

    进一步地,所述步骤S3具体为:

    S31、将处理好的测试数据X输入到复合GA-LSTM模型隐藏层中,GA-LSTM单元受前一阶段训练模型影响,输出预测数据为:P={P1,P2,……,PS},Pp=GA-LSTMcal{Xp,Cp-1,Hp-1},其中,Cp-1、Hp-1分别是前一GA-LSTM单元的状态和输出,GA-LSTMcal是LSTM神经网络的计算过程,网络训练损失函数采用均方误差,即:

    其中:S为时间窗步长,m为训练数据集元素个数,pi为预测数据,yi为实际数据;

    S32、复合GA-LSTM模型中采用经遗传算法选定好的参数,优化目标为损失函数最小化,采用Adam优化算法进行梯度计算,对网络迭代更新不断调整模型权重、降低预测误差。

    进一步地,所述步骤S4具体包括:

    采用训练好的LSTM神经网络模型对预测数据集进行交通流预测,将预测数据同实际数据进行误差计算,所述误差计算采用均方误差和均方根误差两项指标还原预测数据进行输出,在预测中,均方误差和均方根误差的值越小,代表预测精度越高,其中,

    均方误差:

    均方根误差:

    式中,N是数据集个数,Yi是真实数据集,Yi*是预测数据集。

    与现有技术相比,本发明的有益效果在于:

    1、采用遗传算法优化LSTM神经网络模型参数组合,该方法可以在参数空间快速找到最优参数组合;

    2、采用遗传算法和LSTM神经网络模型预测交通流,模型具有长期数据记忆的优势,提高预测精准度;

    3、遗传算法和LSTM神经网络模型对不同时间间隔的数据样本具有良好的适用性。

    4、模型计算量少,表现出更好的预测性能。

    附图说明

    图1是本发明实施例的步骤流程图。

    图2是遗传算法迭代优化目标函数图。

    图3是遗传算法目标函数最优值示意图。

    图4是四种模型5分钟的预测结果。

    图5是四种模型15分钟的预测结果。

    图6是四种模型60分钟的预测结果。

    图7是四种模型60分钟的预测结果。

    图8是四种模型均方误差示意图。

    图9是四种模型均方根误差示意图。

    具体实施方式

    下面结合实例对本发明做进一步的说明,所描述的实施例旨在便于对本发明的理解,而对其不起任何限定作用。

    一种基于遗传算法优化LSTM神经网络的交通流预测方法,主要流程如图1所示,包括如下步骤:

    步骤S1:交通流数据采集,并进行数据归一化预处理,分为训练数据集和测试数据集。

    所述交通流数据来源于高速公路高清卡口检测器,在特定的观测点或者路段,在一定时间间隔内通过的车辆数,时间间隔可以根据实际预测需求制定,本发明采用的是5分钟、15分钟、30分钟、60分钟四个时间间隔样本数据。

    读取获得原始交通流数据DF={df1,df2,……,dfn},采用离差标准化方法对数据归一化:

    其中,di是归一化后的交通流数据,是交通流数据中最小值,是交通流数据最大值,dfi为待归一化处理的交通流数据。

    获得新数据序列D={d1,d2,……,dn},按比例划分训练数据集和测试数据集分别为dtr={d1,d2,……,dm}和dte={dm+1,dm+2,……,dm},其中,将归一化数据的前87.5%为训练数据集,后12.5%为测试数据集。对数据进行时间窗步长处理,设定时间窗步长设定为S,则处理后数据输入为:X={X1,X2,……,XS}。实际对比数据为:Y={Y1,Y2,……,YS}。

    步骤S2:采用遗传算法优化LSTM神经网络预测模型的各个参数。

    所述步骤S2中,所述LSTM神经网络预测模型所需优化的参数包括:LSTM神经网络隐藏层数、时间窗步长、训练次数、遗忘率Dropout,所述遗传算法优化LSTM神经网络的模型是在参数搜索空间里,以预测误差最小为目标函数,进行参数组合寻优。

    所述步骤S2中采用遗传算法对LSTM神经网络预测模型涉及到的参数进行优化时,以预测误差最小为目标函数,获取参数搜索空间的最优解,进行参数组合寻优,形成复合GA-LSTM模型,包括步骤:

    步骤S21、种群初始化并解码;

    步骤S22、将LSTM神经网络的均方误差作为适应度函数;

    步骤S23、将解的个体进行选择交叉变异操作;

    步骤S24、若适应度函数目标值达到最优值,则进行下一步;否则返回步骤S23;

    步骤S25、获得适应度函数目标值和最佳参数;

    步骤S26、计算基于最佳参数的预测均方误差;

    步骤S27、终止条件判断,若种群迭代次数满足,则停止计算,此时LSTM网络全局最优参数组合;否则返回步骤S26。

    步骤S3:输入遗传算法优化好的参数、训练数据集,进行LSTM神经网络预测模型的迭代优化,具体包括:

    S31、将处理好的测试数据X输入到复合GA-LSTM模型隐藏层中,复合GA-LSTM单元受前一阶段训练模型影响,输出预测数据为:P={P1,P2,……,PS},Pp=GA-LSTMcal{Xp,Cp-1,Hp-1},其中,Cp-1、Hp-1分别是前一GA-LSTM单元的状态和输出,GA-LSTMcal是LSTM神经网络的计算过程,网络训练损失函数采用均方误差,即:

    其中:S为时间窗步长,m为训练数据集元素个数,pi为预测数据,yi为实际数据;

    S32、复合GA-LSTM模型中采用经遗传算法选定好的参数,优化目标为损失函数最小化,采用Adam优化算法进行梯度计算,对网络迭代更新不断调整模型权重、降低预测误差。

    步骤S4:利用已训练好的LSTM神经网络模型对测试数据集进行预测,并评估模型误差,具体包括:

    采用训练好的LSTM神经网络模型对预测数据集进行交通流预测,将预测数据同实际数据进行误差计算,还原预测数据进行输出。采用均方误差(MSE)和均方根误差(RMSE)作为评估指标,在预测中,MSE和RMSE的值越小,代表预测精度越高。其中,

    均方误差:

    均方根误差:

    式中,N是数据集个数,Yi是真实数据集,Yi*是预测数据集。

    本发明的有效性可以通过下面的实验来进一步说明,实验中的参数不影响本发明的一般应用性。

    实验平台:处理器为Intel i5-6500,内存为8.0GB;系统是Windows10(64位);程序语言版本为Python3.6.2;集成开发环境为Anaconda包中的spyder3.28版本。

    实验内容:

    广州某段高速公路8天的车道高清卡口检测器的交通流数据作为时间序列预测样本。高速公路作为封闭式通行系统,交通流信息真实性高。高速公路管理部门在对车辆进行进行控制和诱导时,需要提前预估短时间交通流数据,数据采集间隔分别为5分钟,15分钟,30分钟,60分钟四种,能够有效保证管理部门数据预测需求。采用离差标准化方法进行归一化,实验以前7天数据为训练样本,后1天数据为测试样本。

    采用遗传算法优化LSTM模型参数取值,设置种群中个体为50,迭代次数为100,变异概率pm为0.1,交叉概率pc为0.6,以60分钟交通流数据为样本进行分析。

    参数搜索空间:隐藏层数,10-160,步长为10;时间窗步长,1-16,步长为1;训练次数,10-320,步长为10;遗忘率,0.2-0.51,步长为0.01。编码:根据参数性质,采用二进制编码,个体中含有18个基因。[0101,0101,01010,01010]表示为某个体,则四段染色体分别表示为参数隐藏层数、时间窗步长、训练次数、遗忘率的基因型。

    图2表示遗传算法寻优迭代图,图3表示最优值迭代示意图。在遗传算法中,可以在搜索空间快速找到近似最优解。随着迭代步数增加,其最优解的均方误差在减少,实现搜索空间参数组合的最优解。经过遗传算法的寻优,确定LSTM神经网络的参数组合为:时间窗步长为13,隐藏层数为100,训练次数为200,遗忘率为0.37。

    实验选取了在交通流预测中经典预测模型作为对照:支持向量机算法(SVM)、最近邻算法(KNN)、BP神经网络,同本发明的算法(GA-LSTM)进行预测性能对比。图4是四种模型5分钟的预测结果,图5是四种模型15分钟的预测结果,图6是四种模型60分钟的预测结果,图7是四种模型60分钟的预测结果。图8是四种模型均方误差示意图,图9是四种模型均方根误差示意图。

    表1为现有算法交通流预测性能对比

    上述分析说明,本发明提出的一种基于遗传算法优化LSTM神经网络的交通流预测方法,能够获得比现有方法更低的预测误差,改进了交通流预测精度。本发明所提出的方法,在四个不同时间间隔数据中误差均最低,证明了方法具有良好的适用性。具有一定的参考价值和实际经济效益。实验表明,本发明的方法寻优速度快,同传统预测算法中的SVM、KNN和朴素BP神经网络相比较,GA-LSTM对数据预测均方误差和均方根误差最小,模型减少了计算量,表现出更好的预测性能。

    以上是本发明的实施例,但本发明并不局限于上述特定实施方式,凡依本发明技术方案作出的改变,所产生的功能作用未超出本方法技术方案的范围时,其同样应当视作本发明所公开的内容。

    展开全文
  • BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的 输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速...

    一、获取代码方式

    获取代码方式1:
    完整代码已上传我的资源:【交通流预测】基于matlab BP神经网络短时交通流预测【含Matlab源码 687期】

    获取代码方式2:
    通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    备注:
    订阅紫极神光博客付费专栏,可免费获得1份代码(有效期为订阅日起,三天内有效);

    二、BP神经网络简介

    1 BP神经网络概述
    BP(Back Propagation)神经网络是1986年由Rumelhart和McCelland为首的科研小组提出,参见他们发表在Nature上的论文 Learning representations by back-propagating errors 。
    BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的 输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断 调整网络的权值和阈值,使网络的误差平方和最小。

    2 BP算法的基本思想
    上一次我们说到,多层感知器在如何获取隐层的权值的问题上遇到了瓶颈。既然我们无法直接得到隐层的权值,能否先通过输出层得到输出结果和期望输出的误差来间接调整隐层的权值呢?BP算法就是采用这样的思想设计出来的算法,它的基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。
    正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播阶段。
    反向传播时,将输出以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这两个过程的具体流程会在后文介绍。

    BP算法的信号流向图如下图所示
    在这里插入图片描述
    3 BP网络特性分析——BP三要素
    我们分析一个ANN时,通常都是从它的三要素入手,即
    1)网络拓扑结构;
    2)传递函数;
    3)学习算法。
    在这里插入图片描述
    每一个要素的特性加起来就决定了这个ANN的功能特性。所以,我们也从这三要素入手对BP网络的研究。

    3.1 BP网络的拓扑结构
    上一次已经说了,BP网络实际上就是多层感知器,因此它的拓扑结构和多层感知器的拓扑结构相同。由于单隐层(三层)感知器已经能够解决简单的非线性问题,因此应用最为普遍。三层感知器的拓扑结构如下图所示。
    一个最简单的三层BP:
    在这里插入图片描述
    3.2 BP网络的传递函数
    BP网络采用的传递函数是非线性变换函数——Sigmoid函数(又称S函数)。其特点是函数本身及其导数都是连续的,因而在处理上十分方便。为什么要选择这个函数,等下在介绍BP网络的学习算法的时候会进行进一步的介绍。
    单极性S型函数曲线如下图所示。
    在这里插入图片描述
    双极性S型函数曲线如下图所示。
    在这里插入图片描述
    3.3 BP网络的学习算法
    BP网络的学习算法就是BP算法,又叫 δ 算法(在ANN的学习过程中我们会发现不少具有多个名称的术语), 以三层感知器为例,当网络输出与期望输出不等时,存在输出误差 E ,定义如下
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    下面我们会介绍BP网络的学习训练的具体过程。

    4 BP网络的训练分解
    训练一个BP神经网络,实际上就是调整网络的权重和偏置这两个参数,BP神经网络的训练过程分两部分:

    前向传输,逐层波浪式的传递输出值;
    逆向反馈,反向逐层调整权重和偏置;
    我们先来看前向传输。
    前向传输(Feed-Forward前向反馈)
    在训练网络之前,我们需要随机初始化权重和偏置,对每一个权重取[ − 1 , 1 ] [-1,1][−1,1]的一个随机实数,每一个偏置取[ 0 , 1 ] [0,1][0,1]的一个随机实数,之后就开始进行前向传输。

    神经网络的训练是由多趟迭代完成的,每一趟迭代都使用训练集的所有记录,而每一次训练网络只使用一条记录,抽象的描述如下:

    while 终止条件未满足:
        for record:dataset:
            trainModel(record)
    
    

    在这里插入图片描述
    在这里插入图片描述
    4.1 逆向反馈(Backpropagation)
    在这里插入图片描述
    在这里插入图片描述
    4.2 训练终止条件
    每一轮训练都使用数据集的所有记录,但什么时候停止,停止条件有下面两种:
    设置最大迭代次数,比如使用数据集迭代100次后停止训练
    计算训练集在网络上的预测准确率,达到一定门限值后停止训练

    5 BP网络运行的具体流程
    5.1 网络结构
    输入层有n nn个神经元,隐含层有p pp个神经元,输出层有q qq个神经元。

    5.2 变量定义
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    第九步:判断模型合理性
    判断网络误差是否满足要求。
    当误差达到预设精度或者学习次数大于设计的最大次数,则结束算法。
    否则,选取下一个学习样本以及对应的输出期望,返回第三部,进入下一轮学习。

    6 BP网络的设计
    在进行BP网络的设计是,一般应从网络的层数、每层中的神经元个数和激活函数、初始值以及学习速率等几个方面来进行考虑,下面是一些选取的原则。

    6.1 网络的层数
    理论已经证明,具有偏差和至少一个S型隐层加上一个线性输出层的网络,能够逼近任何有理函数,增加层数可以进一步降低误差,提高精度,但同时也是网络 复杂化。另外不能用仅具有非线性激活函数的单层网络来解决问题,因为能用单层网络解决的问题,用自适应线性网络也一定能解决,而且自适应线性网络的 运算速度更快,而对于只能用非线性函数解决的问题,单层精度又不够高,也只有增加层数才能达到期望的结果。

    6.2 隐层神经元的个数
    网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元个数的方法来获得,这在结构实现上要比增加网络层数简单得多。一般而言,我们用精度和 训练网络的时间来恒量一个神经网络设计的好坏:
    (1)神经元数太少时,网络不能很好的学习,训练迭代的次数也比较多,训练精度也不高。
    (2)神经元数太多时,网络的功能越强大,精确度也更高,训练迭代的次数也大,可能会出现过拟合(over fitting)现象。
    由此,我们得到神经网络隐层神经元个数的选取原则是:在能够解决问题的前提下,再加上一两个神经元,以加快误差下降速度即可。

    6.3 初始权值的选取
    一般初始权值是取值在(−1,1)之间的随机数。另外威得罗等人在分析了两层网络是如何对一个函数进行训练后,提出选择初始权值量级为s√r的策略, 其中r为输入个数,s为第一层神经元个数。

    6.4 学习速率
    学习速率一般选取为0.01−0.8,大的学习速率可能导致系统的不稳定,但小的学习速率导致收敛太慢,需要较长的训练时间。对于较复杂的网络, 在误差曲面的不同位置可能需要不同的学习速率,为了减少寻找学习速率的训练次数及时间,比较合适的方法是采用变化的自适应学习速率,使网络在 不同的阶段设置不同大小的学习速率。

    6.5 期望误差的选取
    在设计网络的过程中,期望误差值也应当通过对比训练后确定一个合适的值,这个合适的值是相对于所需要的隐层节点数来确定的。一般情况下,可以同时对两个不同 的期望误差值的网络进行训练,最后通过综合因素来确定其中一个网络。

    7 BP网络的局限性
    BP网络具有以下的几个问题:
    (1)需要较长的训练时间:这主要是由于学习速率太小所造成的,可采用变化的或自适应的学习速率来加以改进。
    (2)完全不能训练:这主要表现在网络的麻痹上,通常为了避免这种情况的产生,一是选取较小的初始权值,而是采用较小的学习速率。
    (3)局部最小值:这里采用的梯度下降法可能收敛到局部最小值,采用多层网络或较多的神经元,有可能得到更好的结果。

    8 BP网络的改进
    P算法改进的主要目标是加快训练速度,避免陷入局部极小值等,常见的改进方法有带动量因子算法、自适应学习速率、变化的学习速率以及作用函数后缩法等。 动量因子法的基本思想是在反向传播的基础上,在每一个权值的变化上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。而自适应学习 速率的方法则是针对一些特定的问题的。改变学习速率的方法的原则是,若连续几次迭代中,若目标函数对某个权倒数的符号相同,则这个权的学习速率增加, 反之若符号相反则减小它的学习速率。而作用函数后缩法则是将作用函数进行平移,即加上一个常数。

    三、部分源代码

    clc
    clear
    load flow.mat
    %--------------------------数据图
    figure(1)
    plot(data)
    xlabel('时间,15min/单位')
    ylabel('交通流量/量')
    
    %训练数据归一化
    
    %%%----------------数据归一化
    [datan,dataps]=mapminmax((data)');
    
    %-------------------------重构数据
    %m=10;
    %tau=1;
    x=datan;
    for t=10:2684
    Data(:,(t-9))=[x(t-9) x(t-8) x(t-7) x(t-6) x(t-5) x(t-4) x(t-3) x(t-2) x(t-1) x(t) x(t+1)];
    end
    
    %--------------------------开始预测
    %准备训练数据和测试数据
    trn_data = zeros(11,2560);
    test_data = zeros(11,100);
    
    % prepare training data
    trn_data=Data(1:11,1:2560);
    
    % prepare checking data
    test_data=Data(1:11,2561:2660);
    
    %训练数据
    input_train=(trn_data(1:10,:));
    output_train=(trn_data(11,:));
    %测试数据
    input_test=(test_data(1:10,:));
    output_test=(test_data(11,:));
    
    %构建BP神经网络
    net=newff(input_train,output_train,[10 1],{'tansig','purelin'},'trainlm');
    
    net.trainParam.epochs=7000;  % 训练次数
    net.trainParam.goal=0.00001;  % 误差期望值
    net.trainParam.lr=0.05;  % 学习率
    
    % returns of the train:
    %   net--New network
    net=train(net,input_train,output_train); 
    
    %BP神经网络预测输出
    y=sim(net,input_test);
    %输出结果反归一化
    BPoutput=mapminmax('reverse',y,dataps);
    output=mapminmax('reverse',output_test,dataps);
    %网络预测结果图形
    figure(2)
    plot(BPoutput,'-r*');   %利用BP产生的预测输出图形
    hold on
    plot(output,'-b+');  %预测数据的输出图形
    legend('预测输出','期望输出')
     
    xlabel('时间,15min/单位')
    ylabel('交通流量/量')
    
    %误差曲线
    [DIM_INPUT LEN_DATA ]=size(test_data);  % Data matrix size (1 input vector per row)
    for tt=1:LEN_DATA,     
             error(tt)=abs((BPoutput(tt)-output(tt))/output(tt));
             ERR(tt)= BPoutput(tt)-output(tt);     % Prediction error
    end
    

    四、运行结果

    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述

    五、matlab版本及参考文献

    1 matlab版本
    2014a

    2 参考文献
    [1] 包子阳,余继周,杨杉.智能优化算法及其MATLAB实例(第2版)[M].电子工业出版社,2016.
    [2]张岩,吴水根.MATLAB优化算法源代码[M].清华大学出版社,2017.
    [3]周品.MATLAB 神经网络设计与应用[M].清华大学出版社,2013.
    [4]陈明.MATLAB神经网络原理与实例精解[M].清华大学出版社,2013.
    [5]方清城.MATLAB R2016a神经网络设计与应用28个案例分析[M].清华大学出版社,2018.

    展开全文
  • 交通流预测原理和支持向量回归(SupportVectorRegression,SVR)理论的基础上,对基 于SVR的短时交通流预测模型中参数选择问题进行了探讨和研究,运用群智能优化方 法...
  • 非参数回归预测方法在交通流短时预测中得到了广泛应用. 针对提高搜索速度和关键参数的优化设置两个 问题, 提出使用KD树作为模式库的存储结构, 能够有效提高搜索速度, 并且能够在实际运行中不断将新发现的交通...
  • 短时交通流预测是目前智能交通领域的研究热点,文中从实际应用的角度出发,提出了用于 流量和速度预测的组合预测模型。该模型包含傅里叶历史估计模型、自回归模型和邻域回归模型 三个子模型。详细介绍了组合预测模型的...
  • 在介绍现有的主要交通流预测方法的基础上,阐述了基于卡尔曼滤波的...实证数据表明,所建立的交通流动态实时预测模型的预测效果比较理想,算法的实时性也满足实际预测系统的要求,可应用交通流预测及交通智能控制。
  • T-MGCN时间多图卷积网络用于交通流预测1.文章信息《Temporal Multi-Graph Convolutional Network for Traffic Flow Predi...

    T-MGCN时间多图卷积网络用于交通流预测

    1.文章信息

    《Temporal Multi-Graph Convolutional Network for Traffic Flow Prediction》

    这是发表在IEEE Transaction on Intelligent Transpotation System上的一篇文章。

    2.摘要

    由于复杂的空间和时间相关性,交通流预测一直是一项具有挑战性的任务。现有的工作试图通过开发各种时空模型来解决这一问题。然而,我们观察到遥远道路之间的语义关联性对于交通流预测也是至关重要的。为了将路网中的空间、时间、语义关联与各种全局特征联合建模,本文提出了T-MGCN (Temporal Multi-Graph Convolutional network)交通流预测深度学习框架。首先,识别了几种不同类型的语义关联,并将道路间的非欧氏空间关联和异构语义关联编码到多个图中,通过多图卷积网络对关联性进行建模。然后利用循环神经网络学习交通流的动态模式,以捕获时间相关性。最后利用全连接神经网络融合时空相关性和全局特征。

    3.动机

    预测交通流的难点主要体现在:(1)空间相关性。城市交通流受路网拓扑结构的影响(一条道路的交通流会对其邻近道路的交通流产生很大的影响),并且空间关联具有方向性,例如下游流量比上游流量对未来的交通状况影响更大。(2) 时间相关性。交通状况随时间动态变化,时间相关性表现为亲近性和周期性:亲近性是指最近时段的交通状况比旧时段的交通状况更相关;周期性是指交通状况在一定的时间间隔内呈现出周期性的变化模式。(3) 语义相关性。由于一些潜在的语义关联,遥远的道路之间也可能存在一定的相关性。例如,具有相似功能的城市道路(如住宅区和商业区)通常具有相似的交通模式。

    近年来,许多研究应用CNN(卷积神经网络)对空间进行建模。然而,CNN最初是为欧几里得空间结构设计的(如二维图像和规则网格),所以它不能完全适应路网复杂的拓扑结构。针对这一问题,人们开始研究用于路网空间建模的图卷积网络(Graph Convolutional Network, GCN)。然而,这些方法在构建图时只考虑了道路之间的拓扑关系,而忽略了所有其他可以衡量道路之间相关性的语义因素(如交通行为和局部功能)。因此本文提出了一个深度学习框架:T-MGCN,它将空间、时间和语义关联与各种全局特征结合在一起,用于路网中的交通流预测。主要贡献如下:

    (1)识别了道路之间的两种语义相关性(历史交通模式相关性和局部区域功能相似性),并使用多个图对空间和语义关联性进行编码。然后提出了一个多图卷积网络来建模和融合这些图。

    (2)识别了各种全局特征(即时间特征、周期性特征和事件特征),并设计了一个深度神经网络来联合建模空间、语义、时间相关性和全局特征。具体来说,我们堆叠了基于多图卷积网络的卷积层、基于GRU (Gated recurrent Unit)的循环层和基于全连接神经网络的输出层。

    (3)在两个真实的交通数据集上进行了的实验。结果表明,与最佳基准模型相比,T-MGCN降低了约3% - 6%的预测误差。

    4.方法

    4.1 问题定义

    将路网表示为一个加权图G = (V,E,W),其中每个节点v表示一条道路,边e表示节点间的相关性,边缘权值表示相关性强度,权重越大,两条路的相关性越高。本文从道路网络拓扑结构(Gr、Gw)、交通模式相关性(Gp)、局部区域功能相似性(Gf)三个方面构建图。将t时刻路网上的交通信息 (如速度、流量等)表示为一个N维向量,其中N为道路数量。交通流预测问题定义为:在Gr、Gw、Gp、Gf的基础上,学习大量的历史交通信息样本来获得反映未来交通信息的函数f:

    图1为TMGCN的结构:

    4.2 输入层

    给定一个交通条件样本St,其输入部分可视为一个N*W的矩阵,其中N为道路数,W为历史交通条件信号数。我们使用窗口大小为w,步长为d的滑动窗口来处理输入,得到一个由K个片段组成的序列。使用这种处理策略的原因如下:首先,每个路段应包含多个交通条件信号,这是由于时间序列数据具有紧密性特征(即相邻时段内的数据具有较强的局部交互作用),这些相邻时段内的局部交互作用由卷积层分别对每个分段进行捕捉,如果w = 1,局部相互作用将被忽略。其次,将交通状况样本的输入部分划分为多个段,便于循环层捕捉时间动态。如果w = W,则时间动态被忽略。

    4.3 卷积层

    1)图的构建: 图的构建是GCNs的关键步骤。如果生成的图不能很好地编码节点之间的相关性,这将无助于模型学习,甚至可能降低预测性能。一般来说,我们会在不同方面对道路相关性较强的边缘赋予较大的权重。我们构建了四种道路图(即Gr、Gw、Gp、Gf),具体如下:

    a)拓扑图Gr:路网的拓扑结构可以用有向图表示Gr =(V, E, Wr ), 边的权重 wr (i, j ) 是从路vi到路vj之间链路数量的倒数(图2),因此,在路网中越近的道路,其权重就越高。邻接矩阵Xr表示为:

    b)加权拓扑图Gw:链接的长度也会影响相关性。因此,我们定义加权拓扑图Gw = (V, E, Ww),边的权重如式3所示,其中len计算路径的长度,邻接矩阵Xw表示为式4:

    c)交通模式图Gp :

    交通模式相似的道路在空间上不一定很近。利用每条道路的历史交通状况数据,通过直接度量每条道路对历史交通状况模式的相似性来挖掘道路间的相关性。具体来说,流量模式图表示为Gp = (V, E, Wp)。边的权重为两条道路历史模式的相似度,计算如下: 首先,给定一条路,我们使用历史平均每周交通状况作为它的交通模式,。其次,给定两条道路,我们使用DTW (Dynamic Time Warping)计算两条路的距离,记为dtw(i , j ),根据公式5将距离度量转换为相似度量。式中,用α来控制距离的衰减率,衰减率应根据所涉及的交通状况的范围来设定。邻接矩阵Xp表示为式6:

    d)区域功能图

    功能相似的城市区域中的道路通常有相似的交通模式,例如,工业区可能在工作日的高峰时间有拥堵的交通流,市中心地区可能在周末有拥堵的交通流。已有研究证明POI (Point Of Interest) 分布可以衡量城市区域的功能性。我们根据以下八类计算POIs的密度:住宅、工作(公司、办公大楼等)、商业(如商场、商店等)、餐馆、学校、交通(例如,火车站、地铁站等)、娱乐(如剧院、酒吧等)和风景(如公园、湖泊等)形成特征向量,pvi [ j ] 表示vi道路周边的j类POI密度,计算方法如式7所示。该方程参考自然语言处理领域的TF-IDF设计,对总体数量较少的POI类别赋予更高的权重。其次,我们使用余弦相似度来度量两条道路pvi和pvj之间的相似度,将其作为权重。则邻接矩阵可表示为式8。

    2)多图卷积网络

    我们利用[30]中的GCN进行卷积操作,捕捉节点之间的关联。每个道路图都被输入到一个单独的GCN。GCN的传播规律如式9所示:

    接下来,我们基于参数矩阵融合方法合并四个特征矩阵(10和11),Wr, Ww, Wp,和Wf是可学习参数,来调节特征矩阵的权重。采用softmax运算对参数矩阵进行归一化处理:

    4.4 循环层

    循环层被用来捕获由特征矩阵序列表示的片段序列中的时间相关性,我们选择了两层堆叠的GRU结构,这是提高模型容量的有效途径。在GRU层之间应用dropout进行正则化。如图3,将上一步处理后的特征矩阵按时间顺序输入到循环层中,取最后一个隐藏状态的输出特征矩阵作为循环层的输出。

    4.5 输出层

    现在已经对路网拓扑结构的空间关联、道路间语义关联和时间关联的紧密性进行了编码,还有其他全局特征可以影响交通状况。因此,在输出最终的特征矩阵之前,我们还提取了以下全局特征:

    1)时间特征:给定一个交通状况样本St,我们考虑一天中的时间,一周中的哪一天和节假日事件作为时间特征。我们提取未来时间t+h的时间特征,以此来预测交通状况。我们将St的路网时间特征矩阵表示为TZt。

    2)周期特征:城市交通流具有很强的周期性,然而,由于W(即交通状况样本输入部分的长度)不能太长,因此循环层只能捕捉短期的周期性。这是因为一个太长的RNN难以训练,而且太长的序列的梯度消失性也会削弱周期性的作用。因此,给定一个交通状况样本St,我们将最后一天同一时间和最后一周同一时间的交通状况作为长期周期性特征。此外,我们考虑一个时间窗口的交通条件信号,而不是使用单一的信号。原因是交通状况通常不是严格的周期(虽然几乎所有工作日都有早高峰时间,但交通高峰可能在每天早上的不同时段出现)。我们将St的路网周期性特征矩阵表示为PZt。

    3)事件特征:在某些情况下,一个事件(例如交通事故和节日聚会)会导致目标区域周围的交通情况在几个小时内发生急剧变化。然而,这种情况的存在是非常罕见的,仅考虑交通状况数据几乎不可能捕捉规律性。为了解决这一问题,我们利用一些事件发布网站(如基于位置的社交网络和公共设施的官方网站)共享的带有位置和时间属性的文本信息,基于深度神经网络识别事件,并捕捉其对未来交通模式的影响。具体来说,给定一个交通状况样本St,我们将每条道路vi附近在输入Int期间发布的文本片段进行聚合,形成文件D(t, i),然后利用TextCNN,通过预先训练的词嵌入层、卷积层、最大超时池化层和全连通层,从D(t, i)中提取特征向量。然后将提取的所有特征向量进行组合,形成St的路网事件特征矩阵,记为EZt。

    第二,融合RZt, TZt, PZt和EZt为一个长特征矩阵:

    然后叠加两层完全连接层,第一层可以被视为一个嵌入层,第二层是用来确保输出矩阵Z具有相同的形式,请注意,全局特性是可选的,我们可以根据数据可用性选择其中任何一个来形成最终的Zt。最后,我们用sigmoid作为激活函数,输出t+h时刻的预测路况信号,记为xt+h。训练模型到预测交通状况信号和真实的交通状况信号之间的RMSE(均方根误差) 最小化。

    5.实验

    我们基于两个真实的交通数据集:HZJTD和PEMSD10来评估我们的模型。

    HZJTD是由杭州综合交通研究中心收集的。该数据通过loop检测器从杭州市主要城区的202条道路上采集,时间为2013年10月16日至2014年10月3日。HZJTD包含交通状况,交通速度和交通拥堵指数。将交通速度作为要预测的交通状况,我们每15分钟计算一次道路上的交通速度。最后,HZJTD包含每条道路的30353条记录。构建杭州市路网拓扑结构(如图4(a)所示),图中的双向道路被视为两条不同的道路。基于百度地图API采集杭州市POIs数据。

    PEMSD10是由加州运输部收集的。在加州所有主要大城市的高速公路系统中,总共部署了39000个传感器。我们随机选取加州10区608个传感器作为数据源(如图4(b)所示),时间为2018年1月1日至2018年3月31日。以15分钟为间隔收集数据集,并以交通速度作为预测的交通状况。最后,每个传感器包含8640条记录。基于谷歌Map API收集加州的POIs。有两件事需要注意。首先,传感器和道路不是一对一对应的(例如,可能会有多个传感器部署在同一段路),所以我们通过使用一个阈值高斯内核建立加权拓扑图,eg.通过式12计算传感器之间的权重,dist(vi , v j )表示传感器vi 、 v j 之间的距离, σ是距离的标准差, κ是距离阈值。其次,PEMSD10还从“交通事故信息”页收集事故报告,包含事故的日期、时间、地点和文字描述等信息。

    POI的收集:首先,百度Map API和谷歌Map API都不允许一次性查询区域内所有的POIs,它们只接受关键字和中心位置作为输入,并返回在中心位置周围满足关键字的预定义数量的POIs。因此,我们基于移动和扫描策略收集POIs,即通过提供不同的POIs类别作为关键字,在中心位置周围多次查询POIs,然后将中心位置移动到下一个附近位置,并重复查询步骤。其次,将POIs投影到道路上,如图5所示:

    预处理: 首先,利用线性插值法对交通速度数据的缺失值进行填充。其次,在输入模型之前,我们使用Min-Max归一化方法将交通速度值缩放到[0,1]范围内。在评估中,我们将预测的交通速度值重新缩放到正常,以与地面真值进行比较。第三,由于时间特征都是类别变量,我们使用one-hot编码为它们形成二元特征向量。

    参数设置: 参数默认值设置如下。HZJTD道路数N = 202条,PEMSD10道路数N = 608条。我们设一个交通状况样本的输入部分长度为W = 96(i.e.24小时),DTW距离的衰减率α = 0.1,形成POIs的正交距离dr = 1,交通条件信号小窗口的周期性特征wp = 4 (i.e.一个小时),κ = 2 km。对于TextCNN,嵌入词的维数为100,输出的特征向量维数为50。在实验中,我们采用了5-fold交叉验证策略。即交通状况样本按时间顺序分为5个集合,每个集合作为一次测试集 (其他4个集合作为训练集),并报告平均性能。利用亚当优化器训练深度神经网络。我们设定学习率为0.001,batch size为32,training epoch为2000。

    评价指标: 我们基于RMSE和MAPE (Mean Absolute Percentage Error)对预测方法的性能进行度量,如式13和式14:

    实验部分:

    实验一:调参。在本实验中,研究了参数w(用于分割输入的滑动窗口的大小)的影响。如图6所示,当w增大时,RMSE和MAPE都是先减小后增大。一方面,滑动窗口获得的每个片段都由一个单独的GCN处理。因此,如果w太小,GCNs很难捕捉到相邻时段的局部相互作用。另一方面,当w太大时,片段的数量会明显减少,因此RNN很难捕捉片段之间的时间相关性。最后,在接下来的实验中,我们设w = 8。

    实验二:组件的影响。我们尝试评估T-MGCN的关键成分,即四个道路图的有效性。我们比较了以下几种T-MGCN变体的性能:T-RGCN:只用拓扑图Gr进行图卷积运算。T-WGCB:只用加权拓扑图Gw进行图卷积运算。T-PGCN:仅用流量模式图Gp进行图卷积运算。T-FGCN:仅用功能图Gf进行图卷积运算。结果如表一所示:T-MGCN优于其他变体,这意味着所有这四个道路图都对最终结果有贡献。其次,除T-MGCN外,T-PGCN的整体性能最好。这表明历史交通格局对未来交通状况具有很强的指示作用。第三,T-FGCN整体表现最差。一个潜在的原因是百度Map API或谷歌Map API收集的POIs被等价地表示为点。实际上,不同规模的POIs对交通状况的影响程度可能不同(例如,大型购物中心对交通状况的影响通常比小型商店的影响更大)。

    然后评估了全局特征的有效性,即时间特征、周期性特征和事件特征。我们比较了以下几种T-MGCN变体的性能:T-MGCN-Time:只考虑输出层的时间特征;T-MGCN-Periodicity:只考虑输出层的周期性特征;T-MGCN-Event:只考虑输出层的事件特征;T-MGCN-None:输出层不考虑所有全局特征。实验结果见表二:(1)T-MGCN整体性能最好,T-MGCN- none整体性能最差。验证了全局特征的有效性。(2)T-MGCN-periodic优于T-MGCN-time,性能几乎与T-MGCN相同。结果表明,在所有的全局特征中,周期性特征是最有效的。这一结果与已有的许多研究成果一致,认为城市交通流通常具有较强的周期性。(3)T-MGCN-Event相对于T-MGCN-None只有微不足道的优势。通过对实验数据的分析,我们发现事件(如交通事故)对PEMSD10中未来交通流的影响非常有限。这可能是因为加州的汽车密度相对较低,所以一个事件不太可能造成严重的交通拥堵。

    实验三:不同条件下的评估。我们尝试研究T-MGCN在不同条件下(如不同时间跨度,不同道路类型)的性能。我们在七种情况下评估了T-MGCN,预测范围设置为5小时:T-MGCN-rh: T-MGCN在高峰时段(7:00-9:00和16:30-18:30)的性能;T-MGCN-np: T-MGCN在非高峰时段的性能;T-MGCN-wd: T-MGCN在工作日的表现;T-MGCN-hd:指T-MGCN在节假日的表现;T-MGCN-er: T-MGCN在城市高速公路上的性能;T-MGCN-ar: T-MGCN在主干道上的性能;T-MGCN- sr: T-MGCN在景区道路上的性能。实验结果如图7所示。注意,PEMSD10只涉及高速公路,所以T-MGCN-ER、TMGCN-AR、T-MGCN-SR仅在HZJTD上进行评估。可以看出,两个数据集上的实验结果是一致的。在正常情况下(如非高峰时段、工作日、城市高速公路和主干道)性能更好。这是因为交通流模式在异常情况下(如高峰时段、节假日、景区道路)更不稳定。

    实验四:与基准模型的比较:结果表明,与CNNs相比,图能更好地模拟路网的空间关联和语义关联。所有方法在PEMSD10上的性能都优于在HZJTD上的性能。原因可能是PEMSD10采集自高速公路,HZJTD采集自各类城市道路(城市高速公路、干线公路、风景名胜区道路)。因此,由于各种各样的城市事件(如交通拥堵、红绿灯等)的影响,华中交大区的交通状况格局将变得更加复杂。最后,T-MGCN在两个数据集中都有最好的性能,与最佳基准模型相比,它减少了约3%到6%的预测误差。所以,在T-MGCN中,将各种关联(即空间、时间和语义关联)和全局特征(即时间、周期性和事件特征)结合在一起可以获得更好的性能。

    实验五:案例研究。在本节中,我们通过案例研究直观地展示了T-MGCN的性能。选取HZJTD数据集中相邻的三条道路,用几种方法绘制交通流预测结果,对未来5小时的交通流量进行预测,如图8所示。可以看出,T-MGCN比其他三种方法更准确地捕捉到了交通速度的时间趋势,与输出平滑预测曲线的FNN和CLTFP相比,T-MGCN和T-GCN能够很好地适应交通速度的急剧变化。此外,T-MGCN的预测曲线总体上能较好地与地面真值曲线对齐。结果表明,T-MGCN能够更好地捕捉道路网络的空间相关性和语义相关性,从而做出更准确的预测。

    6.展望

    今后,我们将从以下几个方面展开工作。首先,大多数交通流预测模型倾向于学习一般的交通模式。然而交通状况可能会在几个小时内发生剧烈变化,这通常是由异常事件(如交通事故、音乐会等)造成的,我们将扩展我们的方法来学习异常事件和交通状况之间的相关性,以及扩展到多步连续交通流预测中。

    Attention

    如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

    展开全文
  • 交通流预测是智能交通系统至关重要的一部分,应用交通流预测的方法非常多,由于实际路况的复杂性和单个.方法的局限性,现有方法的精确度亟待提高。为解决这一问题,采用数据融合的方法,对传感器采集的原始数据做...
  • 实际交通流是一个明显含有噪声的非线性时间序列。针对这一特点提出对此时间序列进行冥函数变换,变换之后的噪声会比原始信号的压缩程度更大,从而降低白噪声对预测结果的不利影响;利用最小二乘支持向量机(LS-SVM)...
  • 现有的交通流预测方法主要采用浅层交通预测模型,在许多实际应用中仍不满足要求。这一情况促使我们重新思考基于大交通数据的深度架构模型的交通流预测问题。本文提出了一种基于深度学习的交通流预测方法,该方法考虑...
  • 1、文章信息《Traffic Flow Prediction via Spatial Temporal Graph Neural Network》。这是北京交通大学发在国际顶级会议WWW...
  • 为便于理解,假设样本有两个属性,可以把属性值分别对应到二维空间轴的x,y轴上,如下图所示: 实例中样本明显的分为两类,黑色实心点不妨为类别一,空心圆点可命名为类别二,在实际应用中会把类别数值化,比如类别...
  • 短时交通流智能混合预测技术:为了克服现有单项预测技术对不同交通流...实际应用结果表明,该混合模型的预测精度高于单项预测模型各自单独使用时的精度,发挥了2种模型各自的优势,是短时交通流预测的一种有效方法.
  • 针对实际交通系统时变复杂的特征和交通流变化的不确定性,基于模式识别的思想,提出了一种小波分析和K近邻非参数回归相结合的交通流组合预测模型。模型首先应用小波分析理论,对原始交通数据进行了消噪处理,使消噪后的...
  • GNN交通流量预测

    千次阅读 多人点赞 2020-11-25 17:14:51
    利用几种典型的图网络进行交通流量的预测
  • 在研究交叉口相关性的基础上,利用逐步回归法预测无检测器...此研究成果有效地解决了无检测器交叉口交通流量的预测问题,它使得只有很少检测器交叉口的城市的交通流诱导成为可能,并为交叉口的宏观管理提供了理论依据。
  • 城市交通控制和诱导系统是智能交通系统(Intelligent Transport System, ITS)的组成部分,而交通流预测特别是短时交通流预测是城市交通控制与交通诱导系统的基础。由于缺乏交通量预测所需历史数据以及判断影响交通...
  • 在演讲中,万怀宇老师介绍了时空交通网络的概念,分别介绍了他在时空栅格数据和时空图数据方面的研究成果,最后分享了这些研究在实际应用中的一些实例。 万老师个人主页:http://faculty.bjtu.edu.cn/8793/ 万怀宇...
  • 论文研究-短时交通流量智能组合预测模型及应用.pdf, ...实际应用表明:该组合模型的预测精度高于单项预测模型各自单独使用时的精度,发挥了两种模型各自的优势,是短时交通流预测的一种有效方法.
  • 1引言随着交通检测技术和智能交通系统的发展,交通管理者能够获得海量的交通数据。...2交通原始数据的选取本文中使用的数据为四川省某市2014年8月6日的交通流数据,这个数据中有很多路段信息,并且...
  • GCN的应用(交通预测)相关论文整理

    千次阅读 多人点赞 2020-02-25 18:29:26
    一些研究引入了卷积神经网络来对空间特征进行提取,但普通卷积局限于处理像图像这种欧几里德结构的数据,对于交通数据这种复杂的拓扑结构效果不是很好。 本文贡献 本文引入了最近比较火的gcn,结合GRU来分别提取交通...
  • 交通预见未来(20): 基于多图卷积神经网络的多模式交通预测应用对比 1、文章信息 随着图网络GCN的大火,各式各样的基于图网络的交通预测论文也层出不穷,多图卷积神经网络便是其中一个小方向。本文对比了公众号前面...
  • 通过对中国上海城市轨道交通短期客流量的预测,验证了该模型。实验表明,STGCNNmetro模型优于7个已知的基线模型(LSVR、PCA‐kNN、NMF‐kNN、Bayesian、MLR、M‐CNN和LSTM)。此外,我们还探讨了模型对其参数的敏感性...
  • 交通流量预测数据集解读

    万次阅读 多人点赞 2020-05-20 16:42:40
    属于时空预测方向,在人工智能相关会议上有不少工作值得借鉴。中科院计算所9楼网数的徐冰冰在github上有建微信群讨论,下周约在计算所给课题组做报告。群中Davidham(宋超,北交)也撰写了不少论文笔记,最近还发现...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,772
精华内容 3,508
关键字:

交通流预测的实际应用