首页 > 专利 > 重庆邮电大学 > 基于多目标回归的高速公路收费站车流量大数据预测方法专利详情

基于多目标回归的高速公路收费站车流量大数据预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2019-04-12

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2019-08-27

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-05-03

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2039-04-12

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201910293785.9	申请日	2019-04-12
公开/公告号	CN110083802B	公开/公告日	2022-05-03
授权日	2022-05-03	预估到期日	2039-04-12
申请年	2019年	公开/公告年	2022年
缴费截止日
分类号	G06F17/18 、G06K9/62 、G06Q50/26	主分类号	G06F17/18
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	7
权利要求数量	8	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2018.07.12吴志洋等.改进的多目标回归实时人脸检测算法《.计算机工程与应用》.2018,第54卷(第11期),1-7. Eleftherios Spyromitros-Xioufis等.Multi-target regression via input spaceexpansion: treating targets as inputs. 《Machine Learning 》.2016,55-98.;
引用专利	US2018197296A	被引证专利
专利权维持	3	专利申请国编码	CN
专利事件	转让	事务标签	公开、实质审查、授权、权利转移

申请人信息

申请人	重庆邮电大学	第一申请人	重庆邮电大学
专利权人	重庆邮电大学	当前专利权人	芽米科技(广州)有限公司
发明人	王进、高选人、孙开伟、许景益、邓欣、陈乔松	第一发明人	王进
地址	重庆市南岸区南山街道崇文路2号	邮编	400065
申请人数量	1	发明人数量	6
申请人所在省	重庆市	申请人所在市	重庆市南岸区

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

重庆市恒信知识产权代理有限公司

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

刘小红、陈栋梁

摘要

本发明请求保护一种基于多目标回归的高速公路收费站车流量大数据预测方法，包括：101对数据进行预处理操作；102对数据进行打标操作；103对数据进行特征工程构建操作；104构建一种结合目标特定特征和目标相关性的多目标回归模型；105通过已建立的模型，根据收费站历史车流量数据、天气数据等信息，预测收费站8点到10点每20分钟的车流量。本发明主要是通过对收费站历史车流量数据、天气数据等信息进行预处理和分析提取特征，建立一种结合目标特定特征和目标相关性的多目标回归模型，预测收费站8点到10点每20分钟的车流量，从而使交通管理部门能够利用大数据及时采取措施减少收费站的拥堵。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2023-01-31	专利权的转移	登记生效日: 2023.01.13 专利权人由重庆邮电大学变更为芽米科技（广州）有限公司地址由400065 重庆市南岸区南山街道崇文路2号变更为510530 广东省广州市黄埔区科丰路85号801房
2	2022-05-03	授权
3	2019-08-27	实质审查的生效	IPC(主分类): G06F 17/18 专利申请号: 201910293785.9 申请日: 2019.04.12
4	2019-08-02	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，包括以下步骤：

101.对历史车流量数据和天气数据进行包括清洗异常值在内的预处理操作；

102.获取8点到10点累计20分钟的总车流量，对20分钟的总车流量求和作为对数据进行的打标操作；

103.对数据进行特征工程构建操作从而得到最终的训练集和测试集，特征工程采用特征群的方法构建流量特征群、时间特征群、天气特征群、离散特征群、交叉特征群；

104.构建结合目标特定特征和目标相关性的多目标回归模型；在多目标回归模型中，需要对每个目标构建其特定特征从而更好地区别每个目标，但同时，目标间是存在相互关联的，所以需要考虑目标相关性关联每个目标，结合了目标特定特征和目标相关性才能更全面地学习到数据中所包含的信息；

105.通过已建立的模型，根据收费站历史车流量数据、天气数据信息，预测8点到10点两小时每20分钟的车流量；
所述步骤104构建一种结合目标特定特征和目标相关性的多目标回归模型，具体包括：
给定训练样本集D＝{(x1,y1),(x2,y2),…,(xn,yn)}，即
表示训练样本集D有n条样本，d维特征，6个目标；其中，(x1,y1)表示第1条样本，x1表示第1条样本的特征向量，y1表示第1条样本的目标向量，…，(xn,yn)表示第n条样本，xn表示第n条样本的特征向量，yn表示第n条样本的目标向量；
T
原始特征矩阵X＝(x1,x2,…,xn) ，即
T T
其中xi＝(xi1,xi2,…,xid) 表示第i个样本的原始特征，1≤i≤n；X·,j＝(x1j,x2j,…,xnj)表示第j个原始特征列，1≤j≤d；
T
目标矩阵Y＝(y1,y2,…,yn) ，即
T
其中yi＝(流量i1,流量i2,…,流量i6) 表示第i个样本的目标，1≤i≤n；Y·,j＝(流量1j,T
流量2j,…,流量nj) 表示第j个目标列，1≤j≤6；
步骤104考虑目标特定特征的具体步骤为：
①对原始特征进行归一化得到构成归一化后的训练样本集
对每个目标Y·,j，以数据集Dj′＝{(X′,Y·,j)}作
为输入进行kmeans聚类，其中1≤j≤6，2≤K≤20；即从2到20之间找到最佳聚类簇数bestk；
②对每个目标Y·,j，以数据集Dj′＝{(X′,Y·,j)}作为输入进行kmeans聚类，其中1≤j≤
6，K＝bestk；由此数据集Dj′被聚为bestk个类，即：
其中表示第K个簇中特征归一化后的所有
样本，对应的特征归一化前的所有样本表示为 X′K表示第K个簇中所
有样本归一化后的特征，对应的归一化前的原始特征则表示为XK；
③对进行kmeans聚类，聚为k类：
其中1≤K≤bestk，ratio是模型的参数，用以控制目标特定特征的规模，设定为01 2 k T
centersjK＝(CjK ,CjK ,…,CjK)
q q q q T
其中CjK＝(CjK1 ,CjK2 ,…,CjKd) 表示DjK的第q个中心点，1≤q≤k
由此数据集Dj＝{(X,Y·,j)}就得到了s个中心点centersj，其中s＝bestk*k，有即：
简化为
sp
④对于数据集Dj＝{(X,Y·,j)}，计算X与centersj的欧式距离得到s个目标特定特征X jsp sp sp T
＝(x j1,x j2,…,x jn) ；
sp sp sp sp T
第i个样本的目标特定特征为x ji＝(x ji1,x ji2,…,x jid) ，对于其第t个分量，即第i个样本的第t个目标特定特征值，有
其中1≤i≤n，1≤t≤s，Cjtd表示第j个目标的第t个聚类中心点的第d个元素。

2.根据权利要求1所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述步骤101历史车流量数据包括收费站ID、收费站容量等级、收费站是否使用电子收费系统、车辆通过该收费站的方向、车辆通过该收费站的时间点、该车辆是客车还是货车，所述天气数据包括日期、小时、大气压、海平面压力、风向、风速、温度、相对湿度、降雨量。

3.根据权利要求1或2所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述步骤101预处理操作包括：
对异常值进行清洗，国庆期间车流量明显增大，属于异常数据，删除国庆期间的样本。

4.根据权利要求3所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述步骤102累计20分钟的总车流量对数据进行打标操作，具体为累加8点到10点两小时每20分钟的车流量，构造6个目标。

5.根据权利要求4所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述步骤103特征工程构建包括构建流量特征群、时间特征群、天气特征群、离散特征群、交叉特征群。

6.根据权利要求5所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述流量特征群包括：7天历史车流量、6点到8点的车流量，以及车流量的均值、方差、中位数、最值在内的统计特征；
所述时间特征群包括：预测当天是周几，是否为周末，是当天的第几小时；
所述天气特征群包括：大气压、海平面压力、风向、风速、温度、相对湿度、降雨量；
所述离散特征群包括：收费站ID、车辆通过收费站的方向、当天是周几、当天的第几个小时进行one‑hot离散；
所述交叉特征群包括：上述特征群的两两交叉。

7.根据权利要求1所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，步骤104训练过程所述考虑目标间相关性的具体步骤为：
①对数据集Dj＝{(X,Y·,j)}，训练模型fj(X)≈Y·,j，其中1≤j≤6；
②计算Y·,j与Y·,～j的相关性，给定阈值threshold，算出与Y·,j的相关性大于threshold的目标值集合Y·,c，即
Y·,c＝{y|corr(Y·,j,Y·,～j)>threshold}
其中threshold＝0.7；
③调用模型fj，得到Y·,c的预测值矩阵为

8.根据权利要求7所述的一种基于多目标回归的高速公路收费站车流量大数据预测方法，其特征在于，所述结合目标特定特征和目标间相关性的具体步骤为：
对数据集Dj＝{(X,Y·,j)}，训练模型
T
对新样本xnew＝(xnew1,xnew2,…,xnewd) ，首先根据中心点centersj算出其目标特定特征，即
sp sp sp sp T
xnew j＝(xnew j1,xnew j2,…,xnew jd)
对于其第t个分量，即第t个目标特定特征值，有
其中1≤i≤n，1≤t≤s；
再调用模型fj，得到Y·,c的预测值矩阵为
最后调用模型fj′，得到新样本xnew的第j个目标的预测值为

说明书

技术领域

[0001] 本发明属于机器学习、大数据处理技术领域，尤其基于多目标回归的高速公路收费站车流量大数据预测方法。

背景技术

[0002] 高速公路收费站是交通网络中众所周知的瓶颈。在高峰时段，收费站排长队可能会压倒交通管理部门。采用有效的先发制人对策来解决这一问题非常有必要。这些对策包括加快收费过程、临时开放更多车道、自适应地调整交通信号等等。但是想要采取这些措施，交通管理部门必须要收到对未来车流量的可靠预测。这些流量不仅仅是一个时段，而是多个时段。这是一个典型的多目标回归问题，因此发明一种基于多目标回归的高速公路收费站车流量大数据预测方法，同时考虑到目标特定特征和目标间相关性，更准确地预测未来车流量。

[0003] 现有技术未考虑到多目标回归，只是分别为每个目标建模。每个目标对应的特征是相同的，无法为每个目标构建目标特定特征，也没有考虑到目标间的相关性。

发明内容

[0004] 本发明旨在解决以上现有技术的问题。提出了一种基于多目标回归的高速公路收费站车流量大数据预测方法。本发明的技术方案如下：

[0005] 一种基于多目标回归的高速公路收费站车流量大数据预测方法，其包括以下步骤：

[0006] 101.对历史车流量数据和天气数据进行包括清洗异常值在内的预处理操作；

[0007] 102.获取8点到10点累计20分钟的总车流量，对20分钟的总车流量求和作为对数据进行的打标操作；

[0008] 103.对数据进行特征工程构建操作从而得到最终的训练集和测试集，特征工程主要采用特征群的方法构建流量特征群、时间特征群、天气特征群、离散特征群、交叉特征群；

[0009] 104.构建结合目标特定特征和目标相关性的多目标回归模型；在多目标回归模型中，需要对每个目标构建其特定特征从而更好地区别每个目标，但同时，目标间是存在相互关联的，所以需要考虑目标相关性关联每个目标，结合了目标特定特征和目标相关性才能更全面地学习到数据中所包含的信息；

[0010] 105.通过已建立的模型，根据收费站历史车流量数据、天气数据信息，预测8点到10点两小时每20分钟的车流量。

[0011] 进一步的，所述步骤101历史车流量数据包括收费站ID、收费站容量等级、收费站是否使用电子收费系统、车辆通过该收费站的方向、车辆通过该收费站的时间点、该车辆是客车还是货车，所述天气数据包括日期、小时、大气压、海平面压力、风向、风速、温度、相对湿度、降雨量。

[0012] 进一步的，所述步骤101预处理操作包括：

[0013] 对异常值进行清洗，国庆期间车流量明显增大，属于异常数据，删除国庆期间的样本.

[0014] 进一步的，所述步骤102累计20分钟的总车流量对数据进行打标操作，具体为累加8点到10点两小时每20分钟的车流量，构造6个目标。

[0015] 进一步的，所述步骤103特征工程构建包括构建流量特征群、时间特征群、天气特征群、离散特征群、交叉特征群。

[0016] 进一步的，所述流量特征群包括：7天历史车流量、6点到8点的车流量，以及车流量的均值、方差、中位数、最值在内的统计特征；

[0017] 所述时间特征群包括：预测当天是周几，是否为周末，是当天的第几小时；

[0018] 所述天气特征群包括：大气压、海平面压力、风向、风速、温度、相对湿度、降雨量；

[0019] 所述离散特征群包括：收费站ID、车辆通过收费站的方向、当天是周几、当天的第几个小时进行one‑hot离散；

[0020] 所述交叉特征群包括：上述特征群的两两交叉，

[0021] 进一步的，所述步骤104构建一种结合目标特定特征和目标相关性的多目标回归模型，具体包括：

[0022] 给定训练样本集D＝{(x1，y1)，(x2，y2)，...，(xn，yn)}，即

[0023]

[0024] 表示训练样本集D有n条样本，d维特征，6个目标；其中，(x1，y1)表示第1条样本，x1表示第1条样本的特征向量，y1表示第1条样本的目标向量，…，(xn，yn)表示第n条样本，xn表示第n条样本的特征向量，yn表示第n条样本的目标向量；

[0025] 原始特征矩阵X＝(x1，x2，...，xn)T，即

[0026]

[0027] 其中xi＝(xi1，xi2，...，xid)T表示第i个样本的原始特征，1≤i≤n；X·，j＝(x1j，Tx2j，...，xnj) 表示第j个原始特征列，1≤j≤d；

[0028] 目标矩阵Y＝(y1，y2，...，yn)T，即

[0029]

[0030] 其中yi＝(流量i1，流量i2，…，流量i6)T表示第i个样本的目标，1≤i≤n；Y·，j＝(流T量1j，流量2j，...，流量nj) 表示第j个目标列，1≤j≤6。

[0031] 进一步的，步骤104考虑目标特定特征的具体步骤为：

[0032] ①对原始特征进行归一化得到构成归一化后的训练样本集对每个目标Y·，j，以数据集Dj′＝{(X′，Y·，j)}
作为输入进行kmeans聚类，其中1≤j≤6，2≤K≤20。即从2到20之间找到最佳聚类簇数bestk；

[0033] ②对每个目标Y·，j，以数据集Dj′＝{(X′，Y·，j)}作为输入进行kmeans聚类，其中1≤j≤6，K＝bestk。由此数据集Dj′被聚为bestk个类，即：

[0034]

[0035] 其中 1≤K≤bestk，表示第K个簇中特征归一化后的所有样本，对应的特征归一化前的所有样本表示为 X′K表示第K个簇中所
有样本归一化后的特征，对应的归一化前的原始特征则表示为XK；

[0036] ③对进行kmeans聚类，聚为k类：

[0037]

[0038] 其中1≤K≤bestk，ratio是模型的参数，用以控制目标特定特征的规模，设定为0＜ratio≤1，由此进行kmeans聚类后得到k个中心点：

[0039] centersjK＝(CjK1，CjK2，...，CjKk)T

[0040] 其中CjKq＝(CjK1q，CjK2q，...，CjKdq)T表示DjK的第q个中心点，1≤q≤k[0041] 由此数据集Dj＝{(X，Y·，j)}就得到了s个中心点centersj，其中s＝bestk*k，有[0042]

[0043] 即：

[0044]

[0045] 简化为

[0046]

[0047] ④对于数据集Dj＝{(X，Y·，j)}，计算X与centersj的欧式距离得到s个目标特定特sp sp sp sp T征X j＝(x j1，x j2，...，x jn) ；

[0048] 第i个样本的目标特定特征为xspji＝(xspji1，xspji2，...，xspjia)T，对于其第t个分量，即第i个样本的第t个目标特定特征值，有

[0049]

[0050] 其中1≤i≤n，1≤t≤s。Cjtd表示第j个目标的第t个聚类中心点的第d个元素；

[0051] 进一步的，步骤104训练过程所述考虑目标间相关性的具体步骤为：

[0052] ①对数据集Dj＝{(X，Y·，j)}，训练模型fj(X)≈Y·，j。其中1≤j≤6；

[0053] ②计算Y·，j与Y·，～j的相关性，给定阈值tkreshold，算出与Y·，j的相关性大于threshold的目标值集合Y·，c，即

[0054] Y·，c＝{y|corr(Y·，j，Y·，～j)＞threshold}

[0055] 其中threshold＝0.7。

[0056] ③调用模型fj，得到Y·，c的预测值矩阵为

[0057] 进一步的，所述结合目标特定特征和目标间相关性的具体步骤为：

[0058] 对数据集Dj＝{(X，Y·，j)}，训练模型

[0059] 对新样本xnew＝(xnew1，xnew2，...，xnewd)T，首先根据中心点centersj算出其目标特定特征，即

[0060] xnewspj＝(xnewspj1，xnewspj2，...，xnewspjd)T

[0061] 对于其第t个分量，即第t个目标特定特征值，有

[0062]

[0063] 其中1≤i≤n，1≤t≤s；

[0064] 再调用模型fj，得到Y·，c的预测值矩阵为

[0065] 最后调用模型fj ′，得到新样本xnew的第j个目标的预测值为

[0066] 本发明的优点及有益效果如下：

[0067] 本发明弥补了传统机器学习算法无法完全考虑到多个目标，也就是多个时段车流量的差异以及关联的问题。突出的创新点在于：

[0068] ①采用分特征群的方式提取特征，使特征提取得更全面；

[0069] ②预测收费站车流量时考虑到了天气因素，更符合现实场景，使预测更为准确；

[0070] ③提出一种多目标回归算法，更好地解决了多个时段车流量的预测问题；

[0071] ④提出的多目标回归算法同时考虑到了目标特定特征和目标间关联性，很好地学习到了目标间的差异以及联系；

[0072] ⑤现有方法对于每个目标都使用同一套特征，本发明通过无监督学习，对每个目标进行划分，找到每个目标下每个划分的代表性样本点，从而通过计算原始样本与代表性样本点的距离找到每个目标的特定特征；

[0073] ⑥现有方法未考虑到目标间的相关性，本发明通过计算相关系数，找到了每个目标相关的目标预测值，进一步挖掘出了数据所包含的信息。

实施方案

[0077] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

[0078] 本发明解决上述技术问题的技术方案是：

[0079] 参考图1，图1为本发明实施例一提供一种基于多目标回归的高速公路收费站车流量大数据预测方法的流程图，具体包括：

[0080] 101.收集历史车流量数据和天气数据并对数据进行预处理操作：收集历史车流量数据、天气数据，具体如下：

[0081] 收集历史车流量数据包括收费站ID、收费站容量等级、收费站是否使用电子收费系统、车辆通过该收费站的方向、车辆通过该收费站的时间点、该车辆是客车还是货车。

[0082]

[0083]

[0084] 表1 历史车流量数据

[0085] 收集天气数据包括日期、小时、大气压、海平面压力、风向、风速、温度、相对湿度、降雨量。

[0086] Filed Type Descriptiondate date 日期
hour int 小时
pressure float 大气压
sea_pressure float 海平面压力
wind_direction float 风向
wind_speed float 风速
temperature float 温度
rel_humidity float 相对湿度
precipitation float 降雨量

[0087] 表2 天气数据

[0088] 数据预处理包括历史车流量数据和天气数据的处理，根据两个数据表的描述以及物理理解进行如下处理：

[0089] 对异常值进行清洗，国庆期间车流量明显增大，属于异常数据，删除国庆期间的样本；

[0090] 102.累计20分钟的总车流量，对数据进行打标操作：具体为累加8点到10点两小时每20分钟的车流量，构造6个目标。

[0091] 103.对训练集和测试集进行特征工程构建操作：包括流量特征群、时间特征群、天气特征群、离散特征群、交叉特征群。

[0092] ①流量特征群：7天历史车流量、6点到8点的车流量，以及车流量的均值、方差、中位数、最值等统计特征；

[0093] ②时间特征群：预测当天是周几，是否为周末，是当天的第几小时；

[0094] ③天气特征群：大气压、海平面压力、风向、风速、温度、相对湿度、降雨量；

[0095] ④离散特征群：收费站ID、车辆通过收费站的方向、当天是周几、当天的第几个小时进行one‑hot离散；

[0096] ⑤交叉特征群：上述特征群的两两交叉，例如流量特征群与时间特征群交叉，可以得到周末的车流量，周一到周末的车流量。

[0097] 104.构建一种结合目标特定特征和目标相关性的多目标回归模型：给定训练样本集D＝{(x1，y1)，(x2，y2)，...，(xn，yn)}，即

[0098]

[0099] 表示训练样本集D有n条样本，d维特征，6个目标。

[0100] 原始特征矩阵X＝(x1，x2，...，xn)T，即

[0101]

[0102] 其中xi＝(xi1，xi2，...，xid)T表示第i个样本的原始特征，1≤i≤n；X·，j＝(x1j，Tx2j，...，xnj) 表示第j个原始特征列，1≤j≤d。

[0103] 目标矩阵Y＝(y1，y2，...，yn)T，即

[0104]

[0105] 其中yi＝(yi1，yi2，...，yim)T表示第i个样本的目标，1≤i≤n；Y·，j＝(y1j，y2j，...，Tynj) 表示第j个目标列，1≤j≤6。

[0106] ①考虑目标特定特征的具体步骤为：

[0107] (1)对原始特征进行归一化得到构成归一化后的训练样本集对每个目标Y·，j，以数据集Dj′＝{(X′，
Y·，j)}作为输入进行kmeans聚类，其中1≤j≤6，2≤K≤20。即从2到20之间找到最佳聚类簇数bestk。

[0108] (2)对每个目标Y·，j，以数据集Dj′＝{(X′，Y·，j)}作为输入进行kmeans聚类，其中1≤j≤6，K＝bestk。由此数据集Dj′被聚为bestk个类，即：

[0109]

[0110] 其中 1≤K≤bestk，表示第K个簇中特征归一化后的所有样本，对应的特征归一化前的所有样本表示为 X′K表示第K个簇中所
有样本归一化后的特征，对应的归一化前的原始特征则表示为XK。

[0111] (3)对进行kmeans聚类，聚为k类：

[0112]

[0113] 其中1≤K≤bestk，ratio是模型的参数，用以控制目标特定特征的规模，设定为0＜ratio≤1。由此进行kmeans聚类后得到k个中心点：

[0114] centersjK＝(CjK1，CjK2，...，CjKk)T

[0115] 其中CjKq＝(CjK1q，CjK2q，...，CjKdq)T表示的第q个中心点，1≤q≤k[0116] 由此数据集Dj＝{(X，Y·，j)}就得到了s个中心点centersj，其中s＝bestk*k，有[0117]

[0118] 即：

[0119]

[0120] 简化为

[0121]

[0122] (4)对于数据集Dj＝{(X，Y·，j)}，计算X与centersj的欧式距离得到s个目标特定特sp sp sp sp T征X j＝(x j1，x j2，...，x jn) 。

[0123] 第i个样本的目标特定特征为xspji＝(xspji1，xspji2，...，xspjid)T，对于其第t个分量，即第i个样本的第t个目标特定特征值，有

[0124]

[0125] 其中1≤i≤n，1≤t≤s。

[0126] ②考虑目标间相关性的具体步骤为：

[0127] (1)对数据集Dj＝{(X，Y·，j)}，训练模型fj(X)≈Y·，j。其中1≤j≤m。

[0128] (2)计算Y·，j与Y·，～j的相关性，给定阈值threshold，算出与Y·，j的相关性大于threshold的目标值集合Y·，c，即

[0129] Y·，c＝{y|corr(Y·，j，Y·，～j)＞threshold}

[0130] 其中threshold＝0.7。

[0131] (3)调用模型fj，得到Y·，c的预测值矩阵为

[0132] ③结合目标特定特征和目标间相关性的具体步骤为：

[0133] 对数据集Dj＝{(X，Y·，j)}，训练模型

[0134] 对新样本xnew＝(xnew1，xnew2，...，xnewd)T，首先根据中心点centersj算出其目标特定特征，即

[0135] xnewspj＝(xnewspj1，xnewspj2，...，xnewspjd)T

[0136] 对于其第t个分量，即第t个目标特定特征值，有

[0137]

[0138] 其中1≤i≤n，1≤t≤s。

[0139] 再调用模型fj，得到Y·，c的预测值矩阵为

[0140] 最后调用模型fj ′，得到新样本xnew的第j个目标的预测值为

[0141] 105.通过已建立的模型，根据收费站历史车流量数据、天气数据等信息，预测8点到10点两小时每20分钟的车流量，MAPE达到0.08，从而使交通管理部门能够利用大数据及时采取措施减少收费站的拥堵。

[0142] 以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

附图说明

[0074] 图1是本发明提供优选实施例一种基于多目标回归的高速公路收费站车流量大数据预测方法的流程图；

[0075] 图2为本发明实施例一种基于多目标回归的高速公路收费站车流量大数据预测方法中的考虑目标特定特征的多目标回归算法的流程图；

[0076] 图3为本发明实施例一种基于多目标回归的高速公路收费站车流量大数据预测方法中的考虑目标间相关性的多目标回归算法的流程图。

1一种基于大数据处理的数据采集设备 2基于化妆品生产的大数据处理方法及生产数据处理中心 3用于大数据清洗的人工智能处理方法及大数据清洗系统 4在大数据场景下的在线办公安防处理方法及大数据服务器 5遥感大数据处理方法、系统及云平台 6一种基于大数据的图形图像处理系统 7一种基于大数据的安防探头分析处理系统 8一种基于自适应表维度划分的大数据处理方法 9一种基于大数据处理的5G通讯基站用光伏支架 10一种应用于数字办公的异常会话大数据处理方法及服务器