首页 > 专利 > 江苏大学 > 一种基于LSTM和BF的高速公路风险预测方法专利详情

一种基于LSTM和BF的高速公路风险预测方法 0 0

实质审查查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-08-25

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-12-21

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-08-25

基本信息

有效性	实质审查	专利类型	发明专利
申请号	CN202110979482.X	申请日	2021-08-25
公开/公告号	CN113744526A	公开/公告日	2021-12-03
授权日		预估到期日	2041-08-25
申请年	2021年	公开/公告年	2021年
缴费截止日
分类号	G08G1/01 、G08G1/017 、G06K9/62	主分类号	G08G1/01
是否联合申请	独立申请	文献类型号	A
独权数量	1	从权数量	9
权利要求数量	10	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	99	专利申请国编码	CN
专利事件		事务标签	公开、实质审查

申请人信息

申请人	江苏大学	第一申请人	江苏大学
专利权人	江苏大学	当前专利权人	江苏大学
发明人	熊晓夏、刘擎超、沈钰杰、蔡英凤、陈龙	第一发明人	熊晓夏
地址	江苏省镇江市京口区学府路301号	邮编	212013
申请人数量	1	发明人数量	5
申请人所在省	江苏省	申请人所在市	江苏省镇江市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明提供了一种基于LSTM和BF的高速公路风险预测方法，包括线下风险预警预测模型训练和线上风险预警模型实时预测；线下风险预警预测模型训练包括构建区分事故与安全状态的LSTM瞬时风险判别模型，以及建立基于递减系数、先验概率和阈值的BF序列风险预测模型；线上风险预警模型实时预测时，以规定周期内各观测点上LSTM瞬时风险判别模型的输出序列为输入向量，以模式内的观测频数占比为先验概率，输入BF序列风险预测模型，最终得到未来路段风险状态预测结果。本发明提高了高速公路实时风险预测的精度。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-12-21	实质审查的生效	IPC(主分类): G08G 1/01 专利申请号: 202110979482.X 申请日: 2021.08.25
2	2021-12-03	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于LSTM和BF的高速公路风险预测方法，其特征在于，包括步骤：
S1，线下风险预警预测模型训练
基于历年高速公路历史交通事故数据，得到K类事故交通时空模式库，统计得到各事故交通时空模式的发生频数；基于事故发生前指定时间内上下游卡口间的时空范围，通过卡口车牌识别历史数据提取多步高频时变变量，构建区分事故与安全状态的LSTM瞬时风险判别模型；以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量，利用低频时变变量和常变量匹配的交通时空模式，建立基于先验概率的BF序列风险预测模型；
S2，线上风险预警模型实时预测
实时获取预测时刻的低频时变变量和预测路段常变量，实时匹配预测时空的交通时空模式；实时采集每一辆经过卡口车辆的牌照、车辆类型、经过时刻和所在车道，提取时间窗内上下游卡口间的多步高频时变变量，输入LSTM瞬时风险判别模型，得到t时刻的LSTM瞬时风险判别模型判别结果；以规定周期内各观测点上LSTM瞬时风险判别模型的输出序列为输入向量，以匹配交通时空模式内的观测频数占比为先验概率，输入BF序列风险预测模型，最终得到未来路段风险状态预测结果。

2.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述LSTM瞬时风险判别模型的构建过程，具体为：
1)基于历史交通事故，以预测时刻t0前tw内上下游卡口M1M2之间的时空范围为输入时间窗，提取T步输入特征向量X＝{x1,x2,…,xt,…,xT}，输出从预测时刻起未来tp时长内有事故发生，得到事故样本；所述预测时刻t0是事故发生时刻tc前tp时间，tp为预测时长；
2)对每一个事故样本同一时段、同一路段的无事故时空范围进行随机下采样，以预测时刻t′0前tw内上下游卡口M1M2之间的时空范围为输入时间窗，提取T步输入特征向量X′＝{x′1,x′2,…,x′t,…,x′T}，输出从预测时刻起未来tp时长内无事故发生，得到非事故样本；
3)融合事故样本和非事故样本，训练LSTM瞬时风险判别模型，使得损失函数最小，得到最终标定的LSTM瞬时风险判别模型。

3.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述LSTM瞬时风险判别模型的输出序列值视为二分类随机变量y∈{0,1}，随机变量y∈{0,1}的取值由参数θ决定，参数θ的期望值表示为：
其中：y为LSTM瞬时风险判别模型的输出序列，m和q分别代表LSTM输出序列事故类和非事故类变量的个数，a和b是beta分布的超参数，分别代表事故类和非事故类的先验概率。

4.根据权利要求3所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述a和b的值随每个样本所处的交通时空模式变化，参数a的值为该样本所处交通时空模式TMc内事故记录的观测频数fc占所有模式总频数的占比，即相应参数
其中fk为各交通时空模式内事故记录的观测频数。

5.根据权利要求4所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述每个样本所处的交通时空模式是通过以下方法确定的：
1)基于高速公路历史交通事故数据，以事故样本的低频时变变量和路段常变量为特征变量[z1,z2,...,zs,...,zS]，通过K‑modes聚类方法得到K类事故模式，每一类事故模式的聚类中心为TMk＝[z1k,z2k,...,zsk,...,zSk]，k＝1,2,...,K；
2)以待确定样本的低频时变变量和路段常变量为该样本的交通时空模式特征变量TMt＝[z1t,z2t,...,zst,...,zSt]，在TMk＝[z1k,z2k,...,zsk,...,zSk]中基于汉明距离进行模式匹配，与TMt汉明距离最小的模式TMc即为该样本所处的交通时空模式。

6.根据权利要求3所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述未来路段风险状态预测是根据所述E(θ|y)与阈值的大小进行判定的，当E(θ|y)＜τ1：预测路段处于低风险状态，当τ1≤E(θ|y)＜τ2：预测路段处于中风险状态，当τ2≤E(θ|y)：预测路段处于高风险状态，其中τ1、τ2分别代表中、高风险状态的阈值。

7.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述LSTM瞬时风险判别模型的隐藏层和Dense全连接输出层中间设有随机失活Dropout，且LSTM瞬时风险判别模型配合使用输入连接权重L2正则化和学习率衰减。

8.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述高频时变变量包括上下游卡口流量、车道间流量差、车道平均流量、路段流量密度和大型/小型车流量比。

9.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述低频时变变量包括季节、周天数、日时段和天气类型。

10.根据权利要求1所述的基于LSTM和BF的高速公路风险预测方法，其特征在于，所述常变量包括路段车道数、道路线形、路段进出口匝道间距和路段进出口匝道个数，并将所述路段进出口匝道间距连续变量按取值区间离散化。

说明书

技术领域

[0001] 本发明涉及交通安全评价和智能交通技术领域，特别是一种基于LSTM(Long Short‑Term Memory，长短期记忆神经网络)和BF(Bayesian Filtering，贝叶斯滤波)的高速公路风险预测方法。

背景技术

[0002] 汽车保有量前六的国家中，我国交通事故致死率远超美国、德国、日本等，且重大交通安全事故伤亡人数与财物损失一直维持在高位，交通安全已成为影响我国社会经济发展的突出问题。研究高速公路交通事故风险状态预测方法，为高速公路交通安全早期预警提供可靠依据，有助于消除安全隐患，预防和减少高速公路交通事故发生。

[0003] 高速公路交通事故风险预测一般基于海量交通流数据，首先对交通事故风险特征进行挖掘和提取，然后根据提取特征建立预测模型，实现对某一路段/区域在未来一段时间内交通事故风险的预测。传统交通事故风险预测通常采用参数模型方法，如多项逻辑回归模型和贝叶斯网络模型等。近年来，也有一些研究引入了非参数的机器学习模型，如K近邻法、支持向量机、随机森林法等。随着深度学习技术的不断发展，许多研究者也将深度网络模型应用在了风险评估领域，如递归神经网络、图卷积网络等。然而目前大部分模型通常需要详细的交通流量、占有率和车速等参数信息，在实际应用方面，特别是对于普遍仅拥有车辆车牌识别数据类型的高速公路卡口系统，仍存在一定局限性。

发明内容

[0004] 针对现有技术中存在不足，本发明提供了一种基于LSTM和BF的高速公路风险预测方法，通过LSTM瞬时风险判别模型学习历史风险数据中存在的时间依赖关系，并通过BF序列风险预测模型融合LSTM瞬时风险判别模型预测结果提高实时风险预测效果，解决通过高速公路卡口数据高效预测事故风险状态的问题。

[0005] 本发明是通过以下技术手段实现上述技术目的的。

[0006] 一种基于LSTM和BF的高速公路风险预测方法，包括步骤：

[0007] S1，线下风险预警预测模型训练

[0008] 基于历年高速公路历史交通事故数据，得到K类事故交通时空模式库，统计得到各事故交通时空模式的发生频数；基于事故发生前指定时间内上下游卡口间的时空范围，通过卡口车牌识别历史数据提取多步高频时变变量，构建区分事故与安全状态的LSTM瞬时风险判别模型；以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量，利用低频时变变量和常变量匹配的交通时空模式，建立基于先验概率的BF序列风险预测模型；

[0009] S2，线上风险预警模型实时预测

[0010] 实时获取预测时刻的低频时变变量和预测路段常变量，实时匹配预测时空的交通时空模式；实时采集每一辆经过卡口车辆的牌照、车辆类型、经过时刻和所在车道，提取时间窗内上下游卡口间的多步高频时变变量，输入LSTM瞬时风险判别模型，得到t时刻的LSTM瞬时风险判别模型判别结果；以规定周期内各观测点上LSTM瞬时风险判别模型的输出序列为输入向量，以匹配交通时空模式内的观测频数占比为先验概率，输入BF序列风险预测模型，最终得到未来路段风险状态预测结果。

[0011] 进一步地，所述LSTM瞬时风险判别模型的构建过程，具体为：

[0012] 1)基于历史交通事故，以预测时刻t0前tw内上下游卡口M1M2之间的时空范围为输入时间窗，提取T步输入高频时变特征向量X＝{x1,x2,…,xt,…,xT}，输出从预测时刻起未来tp时长内有事故发生，得到事故样本；

[0013] 2)对每一个事故样本同一时段、同一路段的无事故时空范围进行随机下采样，以预测时刻t′0前tw内上下游卡口M1M2之间的时空范围为输入时间窗，提取T步输入高频时变特征向量X′＝{x′1,x′2,…,x′t,…,x′T}，输出从预测时刻起未来tp时长内无事故发生，得到非事故样本；

[0014] 3)融合事故样本和非事故样本，训练LSTM瞬时风险判别模型，使得损失函数最小，得到最终标定的LSTM瞬时风险判别模型。

[0015] 更进一步地，所述预测时刻t0是事故发生时刻tc前tp时间，tp为预测时长。

[0016] 进一步地，所述LSTM瞬时风险判别模型的输出序列值视为二分类随机变量y∈{0,1}，随机变量y∈{0,1}的取值由参数θ决定，参数θ的期望值表示为：

[0017]

[0018] 其中：y为LSTM瞬时风险判别模型的输出序列，m和q分别代表LSTM输出序列事故类和非事故类变量的个数，a和b是beta分布的超参数，分别代表事故类和非事故类的先验概率。

[0019] 更进一步地，所述a和b的值随每个样本所处的交通时空模式变化，参数a的值为该样本所处交通时空模式TMc内事故记录的观测频数fc占所有模式总频数的占比，即相应参数其中fk为各交通时空模式内事故记录的观测频数。

[0020] 更进一步地，所述每个样本所处的交通时空模式是通过以下方法确定的：

[0021] 1)基于高速公路历史交通事故数据，以事故样本的低频时变变量和路段常变量为特征变量[z1,z2,...,zs,...,zS]，通过K‑modes聚类方法得到K类事故模式，每一类事故模式的聚类中心为TMk＝[z1k,z2k,...,zsk,...,zSk]，k＝1,2,...,K；

[0022] 2)以待确定样本的低频时变变量和路段常变量为该样本的交通时空模式特征变量 TMt＝[z1t,z2t,...,zst,...,zSt]，在TMk＝[z1k,z2k,...,zsk,...,zSk]中基于汉明距离进行模式匹配，与 TMt汉明距离最小的模式TMc即为该样本所处的交通时空模式。

[0023] 更进一步地，所述未来路段风险状态预测是根据所述E(θ|y)与阈值的大小进行判定的，当E(θ|y)＜τ1：预测路段处于低风险状态，当τ1≤E(θ|y)＜τ2：预测路段处于中风险状态，当τ2≤E(θ|y)：预测路段处于高风险状态，其中τ1、τ2分别代表中、高风险状态的阈值。

[0024] 进一步地，所述LSTM瞬时风险判别模型的隐藏层和Dense全连接输出层中间设有随机失活Dropout，且LSTM瞬时风险判别模型配合使用输入连接权重L2正则化和学习率衰减。

[0025] 进一步地，所述高频时变变量包括上下游卡口流量、车道间流量差、车道平均流量、路段流量密度和大型/小型车流量比。

[0026] 进一步地，所述低频时变变量包括季节、周天数、日时段和天气类型。

[0027] 进一步地，所述常变量包括路段车道数、道路线形、路段进出口匝道间距和路段进出口匝道个数，并将所述路段进出口匝道间距连续变量按取值区间离散化。

[0028] 本发明的有益效果为：

[0029] (1)本发明无需传感器采集详细的交通流量、占有率和车速等参数信息，适用于普遍仅拥有车辆车牌识别数据类型的高速公路卡口系统，具有较高的实用性。

[0030] (2)本发明通过构建LSTM‑BF预测框架，其中LSTM瞬时风险判别模型学习历史风险数据中存在的时间依赖关系，BF序列风险预测模型融合规定周期内LSTM瞬时风险判别模型的预测结果，提高了高速公路实时风险预测精度。

[0031] (3)本发明区分高频时变变量、低频时变变量和道路常变量共三种类型变量，通过高频时变变量构造LSTM瞬时风险判别模型的多步特征输入，通过低频时变变量和道路常变量匹配交通时空模式得到BF序列风险预测模型风险先验概率，充分考虑了不同类型变量对风险预测的差异化影响，提高了高速公路实时风险预测模型的准确性。

实施方案

[0036] 为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施方式做详细说明。

[0037] 如图1所示，一种基于LSTM和BF的高速公路风险预警方法，具体包括如下步骤：

[0038] 步骤一，线下风险预警预测模型训练

[0039] 根据交通事故信息库，获得历年高速公路历史交通事故数据，基于历年高速公路历史交通事故数据，提取事故样本的低频时变变量和路段常变量，通过聚类分析方法得到K类事故模式库，并统计得到各事故模式的发生频数。利用卡口实时信息采集系统采集的车牌识别数据，基于事故发生前指定时间内上下游卡口间的时空范围，采用移动时间窗形式提取多步高频时变特征变量，构建区分事故与安全状态的LSTM瞬时风险判别模型(即深度学习神经网络)。以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量，建立基于先验概率的BF序列风险预测模型。

[0040] 步骤一具体为：

[0041] 步骤(1)，根据高速公路沿线卡口位置，将高速公路主线划分为L个路段，根据交通流方向确定路段上下游卡口关联关系，获取路段常变量，包括路段车道数、道路线形、路段进出口匝道间距、路段进出口匝道个数，并将其中路段进出口匝道间距连续变量按取值区间离散化。

[0042] 步骤(2)，基于高速公路历史交通事故数据，获取步骤(1)划分的各路段历史交通事故记录数据，提取事故发生路段、发生时间(即低频时变变量，具体包括所在季节、周天数(一周内星期几)、日时段(一天内小时数))、天气类型(属于低频时变变量)和步骤(1)所述路段常变量为特征变量[z1,z2,...,zs,...,zS]。基于所述特征变量，通过K‑modes聚类方法得到K 类事故模式，每一类事故模式的聚类中心为TMk＝[z1k,z2k,...,zsk,...,zSk],k＝1,2,...,K，并统计得到各事故模式内事故记录的观测频数f1,f2,…,fK。

[0043] 步骤(3)，利用卡口实时信息采集系统采集的车牌识别数据，基于事故发生前指定时间内上下游卡口间的时空范围，采用移动时间窗形式提取多步高频时变特征变量，构建区分事故与安全状态的LSTM瞬时风险判别模型。所述步骤(3)具体通过以下子步骤来实现：

[0044] 步骤3‑1)，基于卡口实时信息采集系统历史采集的经过卡口的车辆牌照、车辆经过时刻、车辆所在车道和车辆类型(小型车/大型车)信息，统计单位时间内通过各卡口的总流量、分车道流量和分车型流量。

[0045] 步骤3‑2)，采用移动时间窗形式构建LSTM瞬时风险判别模型的事故样本输入和输出，所述步骤3‑2)具体通过以下子步骤来实现：

[0046] 步骤3‑2‑1)，记高速公路历史交通事故数据为D个，根据交通流方向确定路段上下游卡口关联关系确定事故发生路段的上游卡口M1、下游卡口M2和发生时刻tc。

[0047] 步骤3‑2‑2)，如图2所示，以事故发生时刻tc前tp时间为预测时刻t0，即t0＝tc‑tp，tp为预测时长。以t0时刻前tw(单位为分钟min)内上下游卡口M1M2之间的时空范围为输入时间窗，以5min为单位步长，提取T＝tw/5步输入特征向量X＝{x1,x2,…,xt,…,xT}，每步输入 xt包括的高频时变变量有：上下游卡口流量(总流量)、车道间流量差(分车道流量的差值)、车道平均流量(分车道流量的均值)、路段流量密度(总流量除以上下游卡口之间的间距)、大型/小型车流量比(分车型流量的比值)，其中各时变变量均采用z‑score方法进行标准化处理；输入时间窗的移动步长为1min；输出标签记为1，即从预测时刻起未来tp时长内有事故发生，如图3所示。

[0048] 步骤3‑2‑3)，对所有D个记录事故按步骤3‑2‑2)所述方法构建LSTM瞬时风险判别模型正样本的输入和输出，得到共D个LSTM瞬时风险判别模型正样本。按照下采样比例为正样本(事故样本)数：负样本(非事故样本)数＝1：3，对每一个事故样本同一时段、同一路段的无事故时空范围进行随机下采样，并按步骤3‑2‑2)所述方法构建LSTM瞬时风险判别模型负样本的输入，输出标签记为0，即从预测时刻起未来tp时长内无事故发生，得到共3D个 LSTM瞬时风险判别模型负样本。

[0049] 步骤3‑2‑4)，为了避免模型深度过高致使数据过拟合，设LSTM瞬时风险判别模型的隐藏层层数为1，隐藏层节点个数由试验获取。同时，为了防止模型过拟合，在所述隐藏层和 Dense全连接输出层中间加入随机失活Dropout，并配合使用输入连接权重L2正则化和学习率衰减技术来改善过拟合情况。

[0050] 步骤3‑2‑5)，融合步骤3‑2‑3)中的正、负样本为总样本(共D+3D＝4D个)，按训练集、验证集和测试集分别占60％、20％和20％随机抽取样本构成相应集合，以二分类交叉熵损失函数为损失函数，采用Adam优化器，训练步骤3‑2‑4)所述LSTM瞬时风险判别模型使得损失函数最小，得到最终标定的LSTM瞬时风险判别模型。

[0051] 步骤(4)，以规定周期内LSTM瞬时风险判别模型判别结果的序列为输入向量，建立基于先验概率的BF序列风险预测模型。所述步骤(4)具体通过以下子步骤来实现：

[0052] 步骤4‑1)，基于步骤(3)获取的4D个总样本，对于每个样本的预测时刻t0，按时间先后顺序将t0前间隔为1min的N‑1个观测点和t0本身作为该样本的观测周期(即t0‑N+1, t0‑N+2,…,t0共N个观测点)。

[0053] 步骤4‑2)，如图4所示，以步骤4‑1)得到的某样本观测周期内的每一个观测点为预测时刻t0，按步骤3‑2‑2)所述方法得到对应N个观测点的N组LSTM瞬时风险判别模型输入特征，分别输入步骤3‑2‑5)得到的LSTM瞬时风险判别模型，得到观测周期内N个观测点上LSTM瞬时风险判别模型判别结果构成的序列y＝[y1,...,yN]，并以该序列为BF模型的输入向量。BF输出标签与该样本的正负标签一致，若原样本为正样本，则BF输出标签标记为 1，否则标记为0。

[0054] 步骤4‑3)，将LSTM瞬时风险判别模型的输出视为二分类随机变量y∈{0,1}的观测样本，建立基于递减系数、先验概率和阈值的BF序列风险预测模型，所述步骤4‑3)具体通过以下子步骤来实现：

[0055] 步骤4‑3‑1)，随机变量y∈{0,1}的取值由参数θ决定：

[0056] p(y＝1|θ)＝θ

[0057] 其中参数θ代表随机变量y＝1(事故类)的概率。采用beta分布作为参数θ的先验概率分布形式：

[0058]

[0059] 其中Γ(x)是gamma函数，a和b是beta分布的超参数，分别代表两种类别的先验知识，可由两种类别的初始观测频率表示。

[0060] 步骤4‑3‑2)，当给定LSTM输出序列y＝[y1,...,yN]，根据贝叶斯概率公式，参数θ的后验概率p(θ|y)为先验概率beta(θ|a,b)与二项分布概率bin(m|N,θ)的乘积并进行标准化，即：

[0061]

[0062] 其中m和q分别代表LSTM输出序列中y＝1(事故类)和y＝0(非事故类)变量的个数，并满足m+q＝N。则参数θ的期望值可简单表示为：

[0063]

[0064] 步骤4‑3‑3)，考虑到越靠近当前观测时刻t的LSTM瞬时风险判别模型输出应予以更大的权重，加入随观测时间变化的递减函数rn，以提高最终预测结果的准确性：

[0065]

[0066]

[0067] 其中n＝1,2,...,N代表LSTM序列的第n个输出值的序号(N为序列最后一个输出值的序号)；C∈(0,1]为递减常数，其大小将显著影响BF的预测效果，当C取1时，表示LSTM序列中每个输出结果的权重相同；mn和qn代表LSTM序列第n个输出结果的相应标签值，并满足mn+qn＝1，如若输出为事故类(yn＝1)，则标记mn＝1,qn＝0；反之非事故类(yn＝0) 为mn＝0,qn＝1。

[0068] 步骤4‑3‑4)，通过设定阈值τ为BF序列风险预测模型判定最终预测类别，即若E(θ|y)＞τ，则判定为事故类，反之则判定为非事故类(安全类)。

[0069] 步骤4‑4)，基于获取的BF样本训练步骤4‑3)所述BF序列风险预测模型，得到最终标定的BF序列风险预测模型。所述步骤4‑4)具体通过以下子步骤来实现：

[0070] 步骤4‑4‑1)，对步骤4‑1)中所有的样本按步骤4‑2)所述方法构建BF序列风险预测模型样本的输入和输出，最终得到共4D个BF序列风险预测模型样本。

[0071] 步骤4‑4‑2)，根据高速公路历史交通事故数据，提取每个样本对应的季节、周天数、日时段和天气类型低频时变变量。以低频时变变量和步骤(1)获取的样本对应路段常变量为该样本的交通时空模式特征变量TMt＝[z1t,z2t,...,zst,...,zSt]，基于汉明距离在步骤(2)获得的K 类事故模式TMk＝[z1k,z2k,...,zsk,...,zSk],k＝1,2,...,K中进行模式匹配。汉明距离计算方法为：初始化距离值为0；对每一个特征变量zs，若zst＝zsk，则距离值加1，否则距离值保持不变；循环该过程，至所有特征变量[z1,z2,...,zs,...,zS]遍历结束。选取与TMt汉明距离最小的模式TMc为该样本所处的交通时空模式。

[0072] 步骤4‑4‑3)，设步骤4‑3)所述BF序列风险预测模型中参数a和b的值随每个样本所处的交通时空模式变化，参数a的值为该样本所处TMc模式内事故记录的观测频数fc占所有模式总频数的占比，即相应参数

[0073] 步骤4‑4‑4)，按训练集和测试集分别占75％和25％随机抽取步骤4‑4‑1)所获样本构成相应集合，以预测F1值为目标函数，通过网格搜索法获取BF序列风险预测模型其他参数C、 N、τ的最优值C*、N*、τ*，其中各参数备选值：C∈[0.5,1]、N∈[5,15]、τ∈[0.1,1)。最终得到基于{C＝C*，N＝N*，τ＝τ*}最优参数组合的BF序列风险预测模型。

[0074] 步骤二，线上风险预警模型实时预测

[0075] 卡口实时信息采集系统实时采集每一辆经过卡口车辆的牌照、车辆类型、经过时刻和所在车道，通过步骤一所述特征提取方法实时提取时间窗内上下游卡口间的多步高频时变特征变量，输入LSTM瞬时风险判别模型，得到t时刻的LSTM瞬时风险判别模型判别结果。分别通过卡口实时信息采集系统和交通地理信息库实时获取步骤一所述低频时变变量和路段常变量，基于汉明距离在步骤一获得的事故模式库中实时匹配当前交通时空模式，得到当前模式频数与其他模式频数的占比。以规定周期内各观测点上LSTM瞬时风险判别模型判别结果的序列为输入向量，以模式频数占比为风险先验概率，输入BF序列风险预测模型，最终得到未来路段风险状态预测结果。

[0076] 步骤二具体为：

[0077] 步骤(1)，对于预测时刻t，通过卡口实时信息采集系统实时获取步骤一所述低频时变变量，通过交通地理信息库实时获取步骤一所述预测路段常变量。以低频时变变量和预测路段常变量为特征变量TMt＝[z1t,z2t,...,zst,...,zSt]，基于汉明距离在步骤一获得的K类事故模式 TMk＝[z1k,z2k,...,zsk,...,zSk],k＝1,2,...,K中进行实时模式匹配。汉明距离计算方法与步骤一中所述一致。选取与TMt汉明距离最小的模式TMc为预测时刻预测路段所处的交通时空模式。

[0078] 步骤(2)，对于预测路段l，利用该路段上游和下游卡口信息系统分别对每一辆经过上游和下游卡口的车辆拍照并自动识别牌照，具体采集的车辆信息包括车辆牌照、车辆经过时刻、车辆所在车道和车辆类型(小型车/大型车)。基于所述采集信息，按步骤一所述BF序列风险预测模型输入向量构建方法实时确定预测时刻t的观测周期(即t‑N+1,t‑N+2,…,t共N个观测点)，并按步骤一所述LSTM模型多步高频时变特征变量构建方法得到对应N个观测点的N 组LSTM瞬时风险判别模型输入特征，分别输入步骤一训练得到的LSTM瞬时风险判别模型，得到周期内N个观测点上LSTM判别结果构成的序列y＝[y1,...,yN]。

[0079] 步骤(3)，以步骤(1)得到的模式TMc内事故记录的观测频数fc占所有模式总频数的占比为步骤一所述BF序列风险预测模型中参数a的值，即参数以步骤(2)得到的LSTM判别结果序列y＝[y1,...,yN]为BF序列风险预测
模型的输入向量，输入步骤一所述基于参数组合
的BF序列风险预测模型，得到预测时刻预测路段的事故风险概率E(θ|y)。

[0080] 步骤(4)，根据步骤(3)得到的事故风险概率制定相应的高速公路风险预警策略：当步骤(3)所述BF序列风险预测模型输出风险概率E(θ|y)＜τ1：预测路段处于低风险状态，高速公路管理部门无需采取任何处理措施；当τ1≤E(θ|y)＜τ2：预测路段处于中风险状态，高速公路管理部门应加强对该路段的监控，做好预警准备；当τ2≤E(θ|y)：预测路段处于高风险状态，高速公路管理部门应对进出该路段交通流采取平稳措施，对驾驶员予以预警提醒，并做好事故救援准备。其中τ1,τ2∈[0,1]，且τ1＜τ2，分别代表中、高风险状态的阈值。

[0081] 尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

附图说明

[0032] 图1为本发明的基于LSTM和BF的高速公路风险预测方法流程图；

[0033] 图2为本发明的LSTM模型输入时空范围的概念示意图；

[0034] 图3为本发明的LSTM模型多步特征输入(步数T＝4)的概念示意图；

[0035] 图4为本发明的BF模型输入序列的概念示意图。

1地磅无人值守装置 2一种防盗家用摄像头 3智能手表 4一种考虑车队离散特征的公交车和私家车干线绿波同步协调控制方法 5一种LED贴片装置 6一种基于5G通信的火灾监控装置 7一种畜牧养殖用具有火灾报警功能的饲养室 8一种喷雾除尘灯杆的出水组件 9一种检测驾驶员健康状况的系统及方法 10一种智能防盗系统