[0036] 为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施方式做详细说明。
[0037] 如图1所示,一种基于LSTM和BF的高速公路风险预警方法,具体包括如下步骤:
[0038] 步骤一,线下风险预警预测模型训练
[0039] 根据交通事故信息库,获得历年高速公路历史交通事故数据,基于历年高速公路历史交通事故数据,提取事故样本的低频时变变量和路段常变量,通过聚类分析方法得到K类事故模式库,并统计得到各事故模式的发生频数。利用卡口实时信息采集系统采集的车牌识别数据,基于事故发生前指定时间内上下游卡口间的时空范围,采用移动时间窗形式提取多步高频时变特征变量,构建区分事故与安全状态的LSTM瞬时风险判别模型(即深度学习神经网络)。以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量,建立基于先验概率的BF序列风险预测模型。
[0040] 步骤一具体为:
[0041] 步骤(1),根据高速公路沿线卡口位置,将高速公路主线划分为L个路段,根据交通流方向确定路段上下游卡口关联关系,获取路段常变量,包括路段车道数、道路线形、路段进出口匝道间距、路段进出口匝道个数,并将其中路段进出口匝道间距连续变量按取值区间离散化。
[0042] 步骤(2),基于高速公路历史交通事故数据,获取步骤(1)划分的各路段历史交通事故记录数据,提取事故发生路段、发生时间(即低频时变变量,具体包括所在季节、周天数(一周内星期几)、日时段(一天内小时数))、天气类型(属于低频时变变量)和步骤(1)所述路段常变量为特征变量[z1,z2,...,zs,...,zS]。基于所述特征变量,通过K‑modes聚类方法得到K 类事故模式,每一类事故模式的聚类中心为TMk=[z1k,z2k,...,zsk,...,zSk],k=1,2,...,K,并统计得到各事故模式内事故记录的观测频数f1,f2,…,fK。
[0043] 步骤(3),利用卡口实时信息采集系统采集的车牌识别数据,基于事故发生前指定时间内上下游卡口间的时空范围,采用移动时间窗形式提取多步高频时变特征变量,构建区分事故与安全状态的LSTM瞬时风险判别模型。所述步骤(3)具体通过以下子步骤来实现:
[0044] 步骤3‑1),基于卡口实时信息采集系统历史采集的经过卡口的车辆牌照、车辆经过时刻、车辆所在车道和车辆类型(小型车/大型车)信息,统计单位时间内通过各卡口的总流量、分车道流量和分车型流量。
[0045] 步骤3‑2),采用移动时间窗形式构建LSTM瞬时风险判别模型的事故样本输入和输出,所述步骤3‑2)具体通过以下子步骤来实现:
[0046] 步骤3‑2‑1),记高速公路历史交通事故数据为D个,根据交通流方向确定路段上下游卡口关联关系确定事故发生路段的上游卡口M1、下游卡口M2和发生时刻tc。
[0047] 步骤3‑2‑2),如图2所示,以事故发生时刻tc前tp时间为预测时刻t0,即t0=tc‑tp,tp为预测时长。以t0时刻前tw(单位为分钟min)内上下游卡口M1M2之间的时空范围为输入时间窗,以5min为单位步长,提取T=tw/5步输入特征向量X={x1,x2,…,xt,…,xT},每步输入 xt包括的高频时变变量有:上下游卡口流量(总流量)、车道间流量差(分车道流量的差值)、车道平均流量(分车道流量的均值)、路段流量密度(总流量除以上下游卡口之间的间距)、大型/小型车流量比(分车型流量的比值),其中各时变变量均采用z‑score方法进行标准化处理;输入时间窗的移动步长为1min;输出标签记为1,即从预测时刻起未来tp时长内有事故发生,如图3所示。
[0048] 步骤3‑2‑3),对所有D个记录事故按步骤3‑2‑2)所述方法构建LSTM瞬时风险判别模型正样本的输入和输出,得到共D个LSTM瞬时风险判别模型正样本。按照下采样比例为正样本(事故样本)数:负样本(非事故样本)数=1:3,对每一个事故样本同一时段、同一路段的无事故时空范围进行随机下采样,并按步骤3‑2‑2)所述方法构建LSTM瞬时风险判别模型负样本的输入,输出标签记为0,即从预测时刻起未来tp时长内无事故发生,得到共3D个 LSTM瞬时风险判别模型负样本。
[0049] 步骤3‑2‑4),为了避免模型深度过高致使数据过拟合,设LSTM瞬时风险判别模型的隐藏层层数为1,隐藏层节点个数由试验获取。同时,为了防止模型过拟合,在所述隐藏层和 Dense全连接输出层中间加入随机失活Dropout,并配合使用输入连接权重L2正则化和学习率衰减技术来改善过拟合情况。
[0050] 步骤3‑2‑5),融合步骤3‑2‑3)中的正、负样本为总样本(共D+3D=4D个),按训练集、验证集和测试集分别占60%、20%和20%随机抽取样本构成相应集合,以二分类交叉熵损失函数为损失函数,采用Adam优化器,训练步骤3‑2‑4)所述LSTM瞬时风险判别模型使得损失函数最小,得到最终标定的LSTM瞬时风险判别模型。
[0051] 步骤(4),以规定周期内LSTM瞬时风险判别模型判别结果的序列为输入向量,建立基于先验概率的BF序列风险预测模型。所述步骤(4)具体通过以下子步骤来实现:
[0052] 步骤4‑1),基于步骤(3)获取的4D个总样本,对于每个样本的预测时刻t0,按时间先后顺序将t0前间隔为1min的N‑1个观测点和t0本身作为该样本的观测周期(即t0‑N+1, t0‑N+2,…,t0共N个观测点)。
[0053] 步骤4‑2),如图4所示,以步骤4‑1)得到的某样本观测周期内的每一个观测点为预测时刻t0,按步骤3‑2‑2)所述方法得到对应N个观测点的N组LSTM瞬时风险判别模型输入特征,分别输入步骤3‑2‑5)得到的LSTM瞬时风险判别模型,得到观测周期内N个观测点上LSTM瞬时风险判别模型判别结果构成的序列y=[y1,...,yN],并以该序列为BF模型的输入向量。BF输出标签与该样本的正负标签一致,若原样本为正样本,则BF输出标签标记为 1,否则标记为0。
[0054] 步骤4‑3),将LSTM瞬时风险判别模型的输出视为二分类随机变量y∈{0,1}的观测样本,建立基于递减系数、先验概率和阈值的BF序列风险预测模型,所述步骤4‑3)具体通过以下子步骤来实现:
[0055] 步骤4‑3‑1),随机变量y∈{0,1}的取值由参数θ决定:
[0056] p(y=1|θ)=θ
[0057] 其中参数θ代表随机变量y=1(事故类)的概率。采用beta分布作为参数θ的先验概率分布形式:
[0058]
[0059] 其中Γ(x)是gamma函数,a和b是beta分布的超参数,分别代表两种类别的先验知识,可由两种类别的初始观测频率表示。
[0060] 步骤4‑3‑2),当给定LSTM输出序列y=[y1,...,yN],根据贝叶斯概率公式,参数θ的后验概率p(θ|y)为先验概率beta(θ|a,b)与二项分布概率bin(m|N,θ)的乘积并进行标准化,即:
[0061]
[0062] 其中m和q分别代表LSTM输出序列中y=1(事故类)和y=0(非事故类)变量的个数,并满足m+q=N。则参数θ的期望值可简单表示为:
[0063]
[0064] 步骤4‑3‑3),考虑到越靠近当前观测时刻t的LSTM瞬时风险判别模型输出应予以更大的权重,加入随观测时间变化的递减函数rn,以提高最终预测结果的准确性:
[0065]
[0066]
[0067] 其中n=1,2,...,N代表LSTM序列的第n个输出值的序号(N为序列最后一个输出值的序号);C∈(0,1]为递减常数,其大小将显著影响BF的预测效果,当C取1时,表示LSTM序列中每个输出结果的权重相同;mn和qn代表LSTM序列第n个输出结果的相应标签值,并满足mn+qn=1,如若输出为事故类(yn=1),则标记mn=1,qn=0;反之非事故类(yn=0) 为mn=0,qn=1。
[0068] 步骤4‑3‑4),通过设定阈值τ为BF序列风险预测模型判定最终预测类别,即若E(θ|y)>τ,则判定为事故类,反之则判定为非事故类(安全类)。
[0069] 步骤4‑4),基于获取的BF样本训练步骤4‑3)所述BF序列风险预测模型,得到最终标定的BF序列风险预测模型。所述步骤4‑4)具体通过以下子步骤来实现:
[0070] 步骤4‑4‑1),对步骤4‑1)中所有的样本按步骤4‑2)所述方法构建BF序列风险预测模型样本的输入和输出,最终得到共4D个BF序列风险预测模型样本。
[0071] 步骤4‑4‑2),根据高速公路历史交通事故数据,提取每个样本对应的季节、周天数、日时段和天气类型低频时变变量。以低频时变变量和步骤(1)获取的样本对应路段常变量为该样本的交通时空模式特征变量TMt=[z1t,z2t,...,zst,...,zSt],基于汉明距离在步骤(2)获得的K 类事故模式TMk=[z1k,z2k,...,zsk,...,zSk],k=1,2,...,K中进行模式匹配。汉明距离计算方法为:初始化距离值为0;对每一个特征变量zs,若zst=zsk,则距离值加1,否则距离值保持不变;循环该过程,至所有特征变量[z1,z2,...,zs,...,zS]遍历结束。选取与TMt汉明距离最小的模式TMc为该样本所处的交通时空模式。
[0072] 步骤4‑4‑3),设步骤4‑3)所述BF序列风险预测模型中参数a和b的值随每个样本所处的交通时空模式变化,参数a的值为该样本所处TMc模式内事故记录的观测频数fc占所有模式总频数的占比,即 相应参数
[0073] 步骤4‑4‑4),按训练集和测试集分别占75%和25%随机抽取步骤4‑4‑1)所获样本构成相应集合,以预测F1值为目标函数,通过网格搜索法获取BF序列风险预测模型其他参数C、 N、τ的最优值C*、N*、τ*,其中各参数备选值:C∈[0.5,1]、N∈[5,15]、τ∈[0.1,1)。最终得到基于{C=C*,N=N*,τ=τ*}最优参数组合的BF序列风险预测模型。
[0074] 步骤二,线上风险预警模型实时预测
[0075] 卡口实时信息采集系统实时采集每一辆经过卡口车辆的牌照、车辆类型、经过时刻和所在车道,通过步骤一所述特征提取方法实时提取时间窗内上下游卡口间的多步高频时变特征变量,输入LSTM瞬时风险判别模型,得到t时刻的LSTM瞬时风险判别模型判别结果。分别通过卡口实时信息采集系统和交通地理信息库实时获取步骤一所述低频时变变量和路段常变量,基于汉明距离在步骤一获得的事故模式库中实时匹配当前交通时空模式,得到当前模式频数与其他模式频数的占比。以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量,以模式频数占比为风险先验概率,输入BF序列风险预测模型,最终得到未来路段风险状态预测结果。
[0076] 步骤二具体为:
[0077] 步骤(1),对于预测时刻t,通过卡口实时信息采集系统实时获取步骤一所述低频时变变量,通过交通地理信息库实时获取步骤一所述预测路段常变量。以低频时变变量和预测路段常变量为特征变量TMt=[z1t,z2t,...,zst,...,zSt],基于汉明距离在步骤一获得的K类事故模式 TMk=[z1k,z2k,...,zsk,...,zSk],k=1,2,...,K中进行实时模式匹配。汉明距离计算方法与步骤一中所述一致。选取与TMt汉明距离最小的模式TMc为预测时刻预测路段所处的交通时空模式。
[0078] 步骤(2),对于预测路段l,利用该路段上游和下游卡口信息系统分别对每一辆经过上游和下游卡口的车辆拍照并自动识别牌照,具体采集的车辆信息包括车辆牌照、车辆经过时刻、车辆所在车道和车辆类型(小型车/大型车)。基于所述采集信息,按步骤一所述BF序列风险预测模型输入向量构建方法实时确定预测时刻t的观测周期(即t‑N+1,t‑N+2,…,t共N个观测点),并按步骤一所述LSTM模型多步高频时变特征变量构建方法得到对应N个观测点的N 组LSTM瞬时风险判别模型输入特征,分别输入步骤一训练得到的LSTM瞬时风险判别模型,得到周期内N个观测点上LSTM判别结果构成的序列y=[y1,...,yN]。
[0079] 步骤(3),以步骤(1)得到的模式TMc内事故记录的观测频数fc占所有模式总频数的占比为步骤一所述BF序列风险预测模型中参数a的值,即 参数以步骤(2)得到的LSTM判别结果序列y=[y1,...,yN]为BF序列风险预测
模型的输入向量,输入步骤一所述基于 参数组合
的BF序列风险预测模型,得到预测时刻预测路段的事故风险概率E(θ|y)。
[0080] 步骤(4),根据步骤(3)得到的事故风险概率制定相应的高速公路风险预警策略:当步骤(3)所述BF序列风险预测模型输出风险概率E(θ|y)<τ1:预测路段处于低风险状态,高速公路管理部门无需采取任何处理措施;当τ1≤E(θ|y)<τ2:预测路段处于中风险状态,高速公路管理部门应加强对该路段的监控,做好预警准备;当τ2≤E(θ|y):预测路段处于高风险状态,高速公路管理部门应对进出该路段交通流采取平稳措施,对驾驶员予以预警提醒,并做好事故救援准备。其中τ1,τ2∈[0,1],且τ1<τ2,分别代表中、高风险状态的阈值。
[0081] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。