[0003] 本发明的目的在于提供一种基于大数据的出租车实时巡游路线推荐系统及方法,以解决现有技术中的问题。
[0004] 为实现上述目的,本发明提供如下技术方案:
[0005] 一种基于大数据的出租车实时巡游路线推荐系统,所述推荐系统包括候选路线获取模块和实时巡游路线选取模块,所述候选路线获取模块用于获取多条出租车实时巡游的
候选路线,所述实时巡游路线用于从候选路线中选取实时巡游推荐路线。
[0006] 较优化地,所述候选路线获取模块包括起始位置读取模块、目标位置输入模块和候选路线生成模块,所述起始位置读取模块用于读取出租车当前所在位置,所述目标位置
输入模块用于司机输入目标位置,所述候选路线生成模块根据出租车当前所在位置和目标
位置生成若干条从当前所在位置到达目标位置的候选路线。
[0007] 较优化地,所述实时巡游路线选取模块包括客运中心搜索模块、人群密集指数评估模块和实时巡游推荐路线确定模块,所述客运中心搜索模块用于搜索每条候选路线上是
否存在客运中心,所述人群密集指数评估模块用于评估每条候选路线上的人群密集指数,
所述实时巡游推荐路线确定模块根据客运中心搜索模块的搜索结果或人群密集指数评估
模块的评估结果确定实时巡游推荐路线。
[0008] 较优化地,所述人群密集指数计算模块包括间隔距离获取模块、间隔波动计算模块、搜索次数获取模块、搜索次数计算模块、消费人次获取模块、消费人次计算模块、路线长
度获取模块、人群密集指数计算模块和候选路线排序模块,所述间隔距离获取模块用于获
取每条候选路线上相邻商家之间的距离,所述间隔波动计算模块用于计算每条候选路线上
相邻商家之间的距离的波动程度,所述搜索次数获取模块用于获取第一目标时间段中每条
候选路线上的商家在服务器上的被搜索次数,所述搜索次数计算模块用于计算在某条候选
路线上平均每个商家在服务器上被搜索的次数,所述消费人次获取模块用于获取每条候选
路线上每个商家在第二目标时间段中的每天的某一时间段中的消费人次,所述消费人次计
算模块用于计算在某条候选路线上的所有商家在某一时间段的平均消费人次,所述路线长
度获取模块用于获取每条候选路线的长度,所述人群密集指数计算模块根据计算某条候选
路线的人群密集指数,所述候选路线排序模块用于根据每条候选路线的人群密集指数进行
排序评估。
[0009] 一种基于大数据的出租车实时巡游路线推荐方法,所述推荐方法包括以下步骤:
[0010] S1:获取候选路线;
[0011] S2:在候选路线中选取出租车的实时巡游推荐路线。
[0012] 较优化地,所述推荐方法进一步包括以下步骤:
[0013] S1:读取出租车当前所在位置,司机输入目标位置,获取出租车当前位置到目标位置的所有候选路线A1、A2、A3、…An,n为候选路线的条数;
[0014] S2:搜索每条候选路线上是否存在客运中心,若存在候选路线上存在客运中心,则出租车的实时巡游推荐路线为该候选路线,若不存在候选路线上存在客运中心,则评估每
条候选路线的人群密集指数,并根据每条候选路线的人群密集指数选取出租车的实时巡游
推荐路线。
[0015] 较优化地,所述步骤S2中评估每条候选路线的人群密集指数包括以下步骤:
[0016] S21:分别获取每条候选路线上相邻商家之间的距离A11=[B11、B12、B13、…、B1(m1-1)]、A21=[B21、B22、B23、…、B2(m2-1)]、A31=[B31、B32、B33、…、B3(m3-1)]、…、Ai1=[Bi1、Bi2、Bi3、…、Bij、…、Bi(mi-1)] 、…、An1=[Bn1、Bn2、Bn3、…、Bn(mn-1)],其中, Ai1为第i条候选路线上相邻商家之间的距离的合集,Bij为第i条候选路线上第j个商家和第j+1个商家之间的距离,m1、m2、m3、…、mi、…mn分别为候选路线A1、A2、A3、…、Ai、…、An上商家的个数,1<=i<=n,
[0017] 针对每条候选路线,利用下述公式计算第i条候选路线上相邻商家之间的距离的波动程度:
[0018] , ,
[0019] 其中,Li为第i条候选路线上出租车当前所在位置往目标位置方向上第一个商家与最后一个商家之间的路线距离,Ei为第i条候选路线上相邻商家之间的距离的波动程度,
mi为第i条候选路线上的商家的总个数;相邻商家之间的波动程度越小,说明商家的分布比
较均匀,说明商家载到乘客的几率比较稳定。
[0020] S22:分别获取第一目标时间段T1中每条候选路线上的商家在服务器上的被搜索次数A12=[C11、C12、C13、…、C1m1]、A22=[C21、C22、C23、…、C2m2]、A32=[C31、C32、C33、…、C3m3]、…、Ai2=[Ci1、Ci2、Ci3、…、Cij、…、Cimi] 、…、An2=[Cn1、Cn2、Cn3、…、Cnmn],其中,Ai2为第i条候选路线上每个商家在服务器上的被搜索次数的合集,Cij为第i条候选路线上第j个商家在服务器上被
搜索次数;
[0021] 针对每条候选路线,利用下述公式计算在第i条候选路线上平均每个商家在服务器上被搜索的次数:
[0022] ;如果商家在服务器上被搜索到的次数越多,商家的潜在顾客也就越多,所以商家所在候选路线上的潜在乘客也就越多。
[0023] S23:分别获取每条候选路线上每个商家在第二目标时间段T2中的每天的某一时间段T3中的消费人次,并利用下述公式计算该条候选路线上的所有商家在某一时间段T3的
平均消费人次:
[0024] Xi= ;
[0025] 其中,Xi表示第i条候选路线上的所有商家在某一时间段T3的平均消费人次,Pjk为第i条候选路线上第j个商家在第二目标时间段T2中第k天的某一时间段T3中的消费人次,mi
为第i条候选路线上商家的个数,T2表示第二目标时间段的天数;平均消费人次越多,说明
该条候选路线上的人流量越多,人流量多的地方出租车司机更加容易载到乘客。
[0026] S24:分别获取每条候选路线的长度S1、S2、S3、…Sn,Si为第i条候选路线的长度,针对每条候选路线利用下述计算公式计算该条候选路线的人群密集指数:
[0027] ,
[0028] 其中,Yi为第i条候选路线的人群密集指数,Hi为第i条候选路线上平均每个商家在服务器上被搜索的次数,Ei为第i条候选路线上相邻商家之间的距离的波动程度,Xi为第i条
候选路线上的所有商家在某一时间段T3的平均消费人次,通过多角度考虑人群密集指数,
有利于更加客观的评估该条候选路线的人群密集指数。
[0029] S25:将所有候选路线的人群密集指数按照从大到小的顺序排序,取密集指数排名第一所对应的候选路线为实时巡游推荐路线。人群密集指数越高,出租车载到乘客的几率
越大,载到乘客的频率越高。
[0030] 较优化地,所述客运中心包括汽车站、火车站和高铁站。
[0031] 与现有技术相比,本发明的有益效果是:本发明通过获取出租车的起始位置,司机目标位置输入模块获取所有的候选路线,然后在候选路线中选取实时巡游推荐路线,使得
出租车司机能够在巡游推荐路线上能够高效的营运载客。