首页 > 专利 > 杭州电子科技大学 > 基于POI和多源移动数据集的人群出行模式可视分析方法专利详情

基于POI和多源移动数据集的人群出行模式可视分析方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2019-05-13
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-09-06
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-04-06
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2039-05-13
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201910395683.8 申请日 2019-05-13
公开/公告号 CN110119482B 公开/公告日 2021-04-06
授权日 2021-04-06 预估到期日 2039-05-13
申请年 2019年 公开/公告年 2021年
缴费截止日
分类号 G06F16/9537G06F16/29G06F16/22G06F16/2458G06Q50/26G07C5/08G07C5/00 主分类号 G06F16/9537
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 5
权利要求数量 6 非专利引证数量 1
引用专利数量 2 被引证专利数量 0
非专利引证 1、2015.10.08周志光 等.地理空间数据可视分析综述. 《计算机辅助设计与图形学学报》.2018,(第5期),第747-763页. 宋力.考虑多源数据集的交通状态估计方法研究《.中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》.2016,(第08期),C034-467. Wei Zeng 等.Visualizing theRelationship Between Human Mobility andPoints of Interest《.IEEE Transactions onIntelligent Transportation Systems》.2017,第18卷(第8期),2271-2284. Shi Xiaoying 等.Exploring theevolutionary patterns of urban activityareas based on origin-destination data. 《IEEE Access》.2019,第7卷20416-20431.;
引用专利 US2019122229A、US2015287214A 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 僧德文、吕凡顺、史晓颖 第一发明人 僧德文
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州浙科专利事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
吴秉中
摘要
本发明公开了基于POI和多源移动数据集的人群出行模式可视分析方法,属于信息技术领域。包括1:获取出租车数据集、公共自行车数据集,POI数据集,并对数据进行预处理;2:划分时间段,将城市分割为区域,根据时间和区域划分结果,对数据进行聚合;3:对于出租车和公共自行车数据分别构建三维张量;4:采用非负张量分解方法分解三维张量,自动计算得到潜在的出行特征;5:基于张量分解结果,设计全局视图,包括时间图和热力图;6:设计区域视图,包含POI‑mobility图、流量图和区域POI分布图;7:设计位置视图,包括位置POI占比图和位置POI分布图。通过本发明了解土地使用用途、掌握城市活动规律,有助于城市规划。
  • 摘要附图
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图1
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(a)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(b)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(c)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(d)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(e)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图2(f)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图3(a)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图3(b)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图3(c)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图3(d)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图3(e)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图4(a)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图4(b)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图4(c)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图4(d)
    基于POI和多源移动数据集的人群出行模式可视分析方法
  • 说明书附图:图4(e)
    基于POI和多源移动数据集的人群出行模式可视分析方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-04-06 授权
2 2019-09-06 实质审查的生效 IPC(主分类): G06F 16/9537 专利申请号: 201910395683.8 申请日: 2019.05.13
3 2019-08-13 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于包括以下步骤:
步骤1:获取出租车数据集、公共自行车数据集,POI数据集,并对数据进行预处理;
步骤2:划分时间段,将城市分割为区域,根据时间和区域划分结果,对数据进行聚合;
步骤3:对于出租车和公共自行车数据分别构建三维张量;
步骤4:采用非负张量分解方法分解三维张量,自动计算得到潜在的出行特征;
步骤5:基于张量分解结果,设计全局视图,包括时间图和热力图,展示每个移动数据集的时间和空间特征;
步骤6:设计区域视图,包含POI‑mobility图、流量图和区域POI分布图,可视化热力图中某个选定区域的多源出行模式和POI信息间的关联性;
步骤7:设计位置视图,包括位置POI占比图和位置POI分布图,直观展示每个位置周围的POI信息;
所述的步骤5的具体方法如下:
步骤5.1:设计时间图:时间图采用折线图来呈现从因子矩阵C中衍生得到的每种出行模式的时域变化趋势,时间图的x轴对应于一周内的168个小时,y轴表示时间重要性,每一条折线的值为矩阵C中的每一列,对应于一种出行模式,折线的数量和张量的秩R一致;
步骤5.2:设计热力图:热力图展示了从因子矩阵A中衍生得到的空间重要性,共有R张热力图,呈现了在每种出行模式下不同区域的空间重要性,矩阵A的每一列对应于一张热力图,对于一张热力图来说,每个区域用一种灰度绘制,区域的灰度正比于空间重要性值Air,反映了区域i对于第r种出行模式的重要性,采用渐变的灰度映射机制编码空间重要性值,深色区域表示该区域对于当前模式十分重要,而浅区域表示该区域对于当前模式不太重要;
所述的步骤6的具体方法如下:
步骤6.1:设计POI‑mobility图:POI‑mobility图以紧凑的形式同时展示了多源出行模式和POI占比情况,采用饼图表示区域内的POI占比,对于第i个区域,对所有的POI类别所占比例pij(j=1,...,cn)降序排列,cn表示POI类别数,根据pij的大小将饼图划分为扇区,每个扇区的大小正比于pij的大小,根据pij的值沿着y轴以顺时针方向从大到小依次绘制扇区,使用一种灰度代表一个POI类别,在POI‑mobility图的右边显示POI图例,区域中人群出行模式的时间变化通过两个圆环以放射状的形式排放在外圈,最外圈代表使用出租车的出行模式,内圈代表使用自行车的出行模式,圆环被划分为7个扇区,表示一周中的七天,每个圆环上都有两条曲线,代表一周每个小时内该区域中人群的进入量和流出量;
步骤6.2:设计流量图:观察POI‑mobility图中采用不同交通工具出行的高峰期,通过设置约束条件,得到使用某一种交通工具出行的流量图,流量图展示了从当前区域出发或者终止到当前区域的详细的流动信息,所述约束条件包括出行模式约束、时间约束和流量约束,出行模式约束包括使用自行车还是出租车出行的情况,时间约束包括时间段、选择日期类型,选择小时的范围,流量约束通过一个阈值,流量值小于该阈值的轨迹将被忽略,基于定义好的约束条件,流量图通过地图呈现所有满足条件的轨迹,采用点表示一个位置;对于自行车数据来说,点对应于区域中的一个站点;由于出租车的上下车点散布于整个区域中,进一步将区域划分为400m*400m的网格,根据网格对出租车轨迹进行聚合,因此,对于出租车数据来说,代表网格中心,采用带有箭头的弧线表示位置之间的流量,流量的大小根据弧线的粗细和灰度深浅双编码,采用和热力图一样的渐变灰度映射机制,一条深色的粗线表示两个位置之间的流量很大,一条浅色的细线则表示两个位置之间的流量较小;
步骤6.3:设计区域POI分布图:区域POI分布图在地图上绘制了区域中所有的签到地点,其中一个圆点表示一个签到位置,圆点的位置由签到地点的经纬度所确定,圆点的深浅和POI图例一致,圆点的大小正比于该地点的签到总数。

2.根据权利要求1所述的基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于所述的步骤1具体步骤如下:
步骤1.1:获取出租车数据集,将它们存储在数据库中,一条出租车轨迹记录TRTAXI表示如下:
TRTAXI=(pLong,pLat,pTime,dLong,dLat,dTime)
其中pLong和pLat为上车地点的经度和纬度,dLong和dLat为下车地点的经度和纬度,pTime和dTime为上车时间和下车时间;
步骤1.2:获取公共自行车数据集,包括轨迹记录和站点记录,将它们存储在数据库中,一条自行车轨迹记录TRPBS表示如下:
TRPBS=(leaseStation,leaseTime,returnStation,returnTime)
其中leaseStation和returnStation表示借车站点和还车站点,leaseTime和
returnTime表示借车时间和还车时间;
站点记录stationRec包含了站点相关的信息,表示如下:
stationRec=[stationID,stationName,stationLong,stationLat]
其中stationID为站点ID,stationName为站点名称,stationLong和stationLat为站点的经度和纬度;
步骤1.3:以统一的形式表示出租车数据集和公共自行车数据集,采用TRAbs=(DLoc,Ddate,Dhour,ALoc,Adate,Ahour)表示抽象后的移动数据集,其中DLoc和ALoc表示出发和到达的位置,Ddate和Adate表示出发和到达的日期,Dhour和Ahour表示出发和到达的小时;对于公共自行车数据来说,DLoc为借车站点(leaseStation)的经纬度,ALoc为还车站点(returnStation)的经纬度,Ddate/Adate为借车日期/还车日期,Dhour/Ahour为借车小时/还车小时,它们从leaseTime、returnTime中提取得到,对于出租车数据来说,DLoc为上车地点的经纬度,即(pLong,pLat),ALoc为下车地点的经纬度,即(dLong,dLat),Ddate/Adate为上车日期/下车日期,Dhour/Ahour为上车小时/下车小时,它们从pTime、dTime中提取得到;
步骤1.4:获取基于Foursquare的POI数据集,将它们存储在数据库中,每一条签到记录checkinRec表示如下:
checkinRec=[venueID,locName,locLong,locLat,checkinTime]
其中venueID表示签到地点所属的POI类别,locName表示签到地点的名称,locLong和locLat表示签到地点的经纬度,checkinTime为签到时间,一共包含9种POI类别,包括:
Shop&Service,Outdoors&Recreation,Arts&Entertainment,College&University,Professional&Other Places,Nightlife Spot,Travel&Transport,Residence,Event。

3.根据权利要求2所述的基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于所述的步骤2具体步骤如下:
步骤2.1:对分析的时间段按小时划分;
步骤2.2:根据城市道路路网,将城市空间划分为N个区域;
步骤2.3:为了挖掘人群出行周期性的规律,以周为单位对TRAbs进行聚合;时间长度T定义为T={t1,t2,...,tN},N=168,表示一周中的168个小时(从周一到周日),将所有TRAbs记录投影到一周内,获得TRSum;TRSum=(hour,DLoc,ALoc,num),表示在一周中的第[hour,hour+
1]个小时内共有num人从DLoc出发到达ALoc,hour=0,...,167;
步骤2.4根据区域划分结果,将每条checkinRec根据签到地点划分到相关区域,计算每个区域中每种POI类别的占比:
其中pij表示第i个区域中第j种POI类别所占的比例,checkinsij表示在区域i中第j种POI类别的签到总数,cn表示POI类别数,由于共有9个POI类别,因此cn=9。

4.根据权利要求3所述的基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于所述的步骤3的具体方法如下:
对出租车数据和公共自行车数据分别构建三维张量,用 表示, 表示 中所有的元素都是非负值, 的三个维度分别代表N个区域,F个特征和T个时间间隔,时间维度T为一周的168个小时,特征维度记录了每个区域进入和流出的流量值,由于共有N个区域,因此特征维度F=2N,前N个特征代表从一个特定区域出发前往其他区域的流量值,后N个特征代表从其他区域进入当前区域的流量值,张量的每个元素 表示区域i的第j个特征在第k个小时的值,具体来说,对于区域i, 表示从区域i出发到达区域j在第k个小时的流量值, 表示从区域j出发到达区域i在第k个小时的流量值,这些值从TRSum中得到。

5.根据权利要求4所述的基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于所述的步骤4的具体方法如下:
采用基于PARAFAC的非负张量分解方法来提取潜在的出行特征,将张量 分解为一系列一阶张量的线性组合:
其中R为张量的秩,对应于期望得到的出行模式数,矩阵A,B,C为张量 分解后得到的三个因子矩阵, A,B,C的列为ar,br,cr,符号 表示向量的外积,张
量 的每个元素被写为:
其中Air表示区域i对于第r种出行模式的空间重要性,Ckr表示第k个小时对于第r种出行模式的时间重要性,Bjr表示第j个特征在第r种出行模式中的强度,张量分解结果包含了一系列可解释的时空模式。

6.根据权利要求1所述的基于POI和多源移动数据集的人群出行模式可视分析方法,其特征在于所述的步骤7的具体方法如下:
当点击流量图上的一个点时,更新位置视图;
对于自行车数据来说,当点击一个点时就选择了一个站点,该位置对应的POI信息包含以该站点为中心、半径为radius的圆形中所有的POI,圆形的半径radius可以修改,位置POI占比图展示了圆形范围内各种POI类别的占比情况,位置POI分布图绘制了圆形范围内所有的POI,其中所选的站点由一个五角星表示,一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数,当点击这个圆点时,将显示对应签到地点的名称和签到总数;
对于出租车数据,点表示网格中心,位置POI占比图展示了网格中各种POI类别的占比,位置POI分布图绘制出网格中所有的POI,绘制方式和自行车数据类似,网格中的一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数,当点击这个圆点时,将显示对应签到地点的名称和签到总数。
说明书

技术领域

[0001] 本发明属于信息技术领域,具体涉及基于POI和多源移动数据集的人群出行模式可视分析方法。

背景技术

[0002] 理解人群出行模式对于城市规划者和决策者都十分重要。随着信息技术的发展,大规模和高质量的个人移动数据集可以通过各种途径获得。这些数据集包含了一段时间内人们访问的地点和时间,反映了人们日常的出行行为。此外,一个区域的土地使用类型同样对分析人群出行规律具有重要影响。人们通常前往不同的地方完成不同的活动,如前往学校学习、前往商场购物等。一个区域的POI(Point‑of‑interest)信息反映了区域潜在的功能。基于位置的社交网络,如Foursquare,提供了大量与POI相关的签到数据,能从中分析城市土地的使用类型。
[0003] 现有方法仅利用某一类移动数据集来挖掘人群出行模式,如出租车数据集、公共自行车数据集、公交车数据集等,无法比较人们采用不同交通工具出行的特征差异。而现实中,为了达到不同的出行目的,人们通常使用不同的交通工具前往不同的地方。隐藏在多源移动数据集中的信息为挖掘人类移动模式提供了前所未有的洞察力。现有方法无法综合使用多源移动数据集和POI信息来分析人群出行模式。如何综合利用多个数据集来感知人们真实的出行状态,发现隐含在不同数据集中的重要模式存在挑战:1)不同的移动数据集具有不同的形式,如何从不同的移动数据集中提取统一的特征来描述潜在的出行模式。2)移动数据集和POI数据集是异构的,如何以一种直观的方式展示人群出行和POI分布之间的关系,辅助分析人员进行规律分析。

发明内容

[0004] 针对现有技术中存在的技术问题,本发明提供了一种基于POI和多源移动数据集的人群出行模式可视分析方法。本发明不仅能够自动地从多源移动数据集中计算统一的出行特征,而且能够辅助分析者渐进式、交互式地理解人群出行模式。其中多源移动数据集包括出租车数据集和公共自行车数据集。分析者可以通过与丰富的可视化组件进行交互,找到人们采用不同交通工具出行的特征差异,分析真实的城市土地混合功能,有助于相关人员更好地进行交通管理和城市规划,促进智慧城市的构建。
[0005] 基于POI和多源移动数据集的人群出行模式可视分析方法,包括以下步骤:
[0006] 步骤1:获取出租车数据集、公共自行车数据集,POI数据集,并对数据进行预处理;
[0007] 步骤2:划分时间段,将城市分割为区域,根据时间和区域划分结果,对数据进行聚合;
[0008] 步骤3:对于出租车和公共自行车数据分别构建三维张量;
[0009] 步骤4:采用非负张量分解方法分解三维张量,自动计算得到潜在的出行特征;
[0010] 步骤5:基于张量分解结果,设计全局视图,包括时间图和热力图,展示每个移动数据集的时间和空间特征;
[0011] 步骤6:设计区域视图,包含POI‑mobility图、流量图和区域POI分布图,可视化热力图中某个选定区域的多源出行模式和POI信息间的关联性;
[0012] 步骤7:设计位置视图,包括位置POI占比图和位置POI分布图,直观展示每个位置周围的POI信息。
[0013] 进一步的,所述的步骤1具体步骤如下:
[0014] 步骤1.1:获取出租车数据集,将它们存储在数据库中。一条出租车轨迹记录TRTAXI表示如下:
[0015] TRTAXI=(pLong,pLat,pTime,dLong,dLat,dTime)
[0016] 其中pLong和pLat为上车地点的经度和纬度,dLong和dLat为下车地点的经度和纬度,pTime和dTime为上车时间和下车时间;
[0017] 步骤1.2:获取公共自行车数据集,包括轨迹记录和站点记录,将它们存储在数据库中,一条自行车轨迹记录TRPBS表示如下:
[0018] TRPBS=(leaseStation,leaseTime,returnStation,returnTime)
[0019] 其中leaseStation和returnStation表示借车站点和还车站点,leaseTime和returnTime表示借车时间和还车时间;
[0020] 站点记录stationRec包含了站点相关的信息,表示如下:
[0021] stationRec=[stationID,stationName,stationLong,stationLat]
[0022] 其中stationID为站点ID,stationName为站点名称,stationLong和stationLat为站点的经度和纬度;
[0023] 步骤1.3:以统一的形式表示出租车数据集和公共自行车数据集。采用TRAbs=(DLoc,Ddate,Dhour,ALoc,Adate,Ahour)表示抽象后的移动数据集,其中DLoc和ALoc表示出发和到达的位置,Ddate和Adate表示出发和到达的日期,Dhour和Ahour表示出发和到达的小时;对于公共自行车数据来说,DLoc为借车站点(leaseStation)的经纬度,ALoc为还车站点(returnStation)的经纬度,Ddate/Adate为借车日期/还车日期,Dhour/Ahour为借车小时/还车小时,它们可以从leaseTime、returnTime中提取得到,对于出租车数据来说,DLoc为上车地点的经纬度,即(pLong,pLat),ALoc为下车地点的经纬度,即(dLong,dLat),Ddate/Adate为上车日期/下车日期,Dhour/Ahour为上车小时/下车小时,它们可以从pTime、dTime中提取得到;
[0024] 步骤1.4:获取基于Foursquare的POI数据集,将它们存储在数据库中,每一条签到记录checkinRec表示如下:
[0025] checkinRec=[venueID,locName,locLong,locLat,checkinTime]
[0026] 其中venueID表示签到地点所属的POI类别,locName表示签到地点的名称,locLong和locLat表示签到地点的经纬度,checkinTime为签到时间,一共包含9种POI类别,包括:Shop&Service,Outdoors&Recreation,Arts&Entertainment,College&University,Professional&Other Places,Nightlife Spot,Travel&Transport,Residence,Event。
[0027] 进一步的,所述的步骤2具体步骤如下:
[0028] 步骤2.1:对分析的时间段按小时划分;
[0029] 步骤2.2:根据城市道路路网,将城市空间划分为N个区域;
[0030] 步骤2.3:为了挖掘人群出行周期性的规律,以周为单位对TRAbs进行聚合;时间长度T定义为T={t1,t2,...,tN},N=168,表示一周中的168个小时(从周一到周日),将所有TRAbs记录投影到一周内,获得TRSum;TRSum=(hour,DLoc,ALoc,num),表示在一周中的第[hour,hour+1]个小时内共有num人从DLoc出发到达ALoc,hour=0,...,167;
[0031] 步骤2.4根据区域划分结果,将每条checkinRec根据签到地点划分到相关区域,计算每个区域中每种POI类别的占比:
[0032]
[0033] 其中pij表示第i个区域中第j种POI类别所占的比例,checkinsij表示在区域i中第j种POI类别的签到总数,cn表示POI类别数,由于共有9个POI类别,因此cn=9。
[0034] 进一步的,所述的步骤3的具体方法如下:
[0035] 对出租车数据和公共自行车数据分别构建三维张量,用 表示, 表示中所有的元素都是非负值, 的三个维度分别代表N个区域,F个特征和T个时间间隔,时间维度T为一周的168个小时,特征维度记录了每个区域进入和流出的流量值,由于共有N个区域,因此特征维度F=2N,前N个特征代表从一个特定区域出发前往其他区域的流量值,后N个特征代表从其他区域进入当前区域的流量值,张量的每个元素 表示区域i的第j个特征在第k个小时的值,具体来说,对于区域i, 表示从区域i出发到达区域j在第k个小时的流量值, 表示从区域j出发到达区域i在第k个小时的流量值,这些值可以从TRSum中得到。
[0036] 进一步的,所述的步骤4的具体方法如下:
[0037] 采用基于PARAFAC的非负张量分解方法来提取潜在的出行特征,将张量 分解为一系列一阶张量的线性组合:
[0038]
[0039] 其中R为张量的秩,对应于期望得到的出行模式数,矩阵A,B,C为张量 分解后得到的三个因子矩阵, A,B,C的列为ar,br,cr,符号 表示向量的外积,张量 的每个元素可以被写为:
[0040]
[0041] 其中Air表示区域i对于第r种出行模式的空间重要性,Ckr表示第k个小时对于第r种出行模式的时间重要性,Bjr表示第j个特征在第r种出行模式中的强度,张量分解结果包含了一系列可解释的时空模式。
[0042] 进一步的,所述的步骤5的具体方法如下:
[0043] 步骤5.1:设计时间图:时间图采用折线图来呈现从因子矩阵C中衍生得到的每种出行模式的时域变化趋势,时间图的x轴对应于一周内的168个小时,y轴表示时间重要性,每一条折线的值为矩阵C中的每一列,对应于一种出行模式,折线的数量和张量的秩R一致;
[0044] 步骤5.2:设计热力图:热力图展示了从因子矩阵A中衍生得到的空间重要性,共有R张热力图,呈现了在每种出行模式下不同区域的空间重要性,矩阵A的每一列对应于一张热力图,对于一张热力图来说,每个区域用一种灰度绘制,区域的灰度正比于空间重要性值Air,反映了区域i对于第r种出行模式的重要性,采用渐变的灰度映射机制编码空间重要性值,深色区域表示该区域对于当前模式十分重要,而浅区域表示该区域对于当前模式不太重要。
[0045] 进一步的,所述的步骤6的具体方法如下:
[0046] 步骤6.1:设计POI‑mobility图:POI‑mobility图以紧凑的形式同时展示了多源出行模式和POI占比情况,采用饼图表示区域内的POI占比,对于第i个区域,对所有的POI类别所占比例pij(j=1,...,cn)降序排列,根据pij的大小将饼图划分为扇区,每个扇区的大小正比于pij的大小。根据pij的值沿着y轴以顺时针方向从大到小依次绘制扇区,使用一种灰度代表一个POI类别,在POI‑mobility图的右边显示POI图例,区域中人群出行模式的时间变化通过两个圆环以放射状的形式排放在外圈,最外圈代表使用出租车的出行模式,内圈代表使用自行车的出行模式,圆环被划分为7个扇区,表示一周中的七天,每个圆环上都有两条曲线,代表一周每个小时内该区域中人群的进入量和流出量;
[0047] 步骤6.2:设计流量图:观察POI‑mobility图中采用不同交通工具出行的高峰期,通过设置约束条件,得到使用某一种交通工具出行的流量图,流量图展示了从当前区域出发或者终止到当前区域的详细的流动信息,所述约束条件包括出行模式约束、时间约束和流量约束,出行模式约束包括使用自行车还是出租车出行的情况,时间约束包括时间段、选择日期类型(工作日、周末),选择小时的范围,流量约束通过一个阈值,流量值小于该阈值的轨迹将被忽略,基于定义好的约束条件,流量图通过地图呈现所有满足条件的轨迹,采用点表示一个位置;对于自行车数据来说,点对应于区域中的一个站点;由于出租车的上下车点散布于整个区域中,进一步将区域划分为400m*400m的网格,根据网格对出租车轨迹进行聚合,因此,对于出租车数据来说,代表网格中心,采用带有箭头的弧线表示位置之间的流量,流量的大小根据弧线的粗细和灰度深浅双编码,采用和热力图一样的渐变灰度映射机制,一条深色的粗线表示两个位置之间的流量很大,一条浅色的细线则表示两个位置之间的流量较小;
[0048] 步骤6.3:设计区域POI分布图:区域POI分布图在地图上绘制了区域中所有的签到地点,其中一个圆点表示一个签到位置,圆点的位置由签到地点的经纬度所确定,圆点的深浅和POI图例一致,圆点的大小正比于该地点的签到总数。
[0049] 进一步的,所述的步骤7的具体方法如下:
[0050] 当点击流量图上的一个点时,更新位置视图。
[0051] 对于自行车数据来说,当点击一个点时就选择了一个站点,该位置对应的POI信息包含以该站点为中心、半径为radius的圆形中所有的POI,圆形的半径radius可以修改,位置POI占比图展示了圆形范围内各种POI类别的占比情况,位置POI分布图绘制了圆形范围内所有的POI,其中所选的站点由一个五角星表示,一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数,当点击这个圆点时,将显示对应签到地点的名称和签到总数;
[0052] 对于出租车数据,点表示网格中心,位置POI占比图展示了网格中各种POI类别的占比,位置POI分布图绘制出网格中所有的POI,绘制方式和自行车数据类似,网格中的一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数,当点击这个圆点时,将显示对应签到地点的名称和签到总数。
[0053] 本发明的方法的特色和创新在于,提出了一种新的可视分析方法,能够针对多源移动数据集和POI信息分析和挖掘人群出行规律。基于不同移动数据集构建的三维张量能以一种统一的形式描述不同的数据集,采用非负张量分解方法能自动地从多源移动数据集中提取得到隐藏的时空模式。POI‑mobility图能够以一种紧凑的形式同时展示多源移动数据集和POI占比的情况。通过与设计得到的多个可视分析视图交互,分析者不仅能推理人群访问某个区域的目的,而且能分析得到一个区域所具有的混合功能。分析结果能帮助交通管理人员、城市规划人员了解土地真实的使用用途、掌握人们采用不同交通工具在城市中活动的时空规律,这些规律是仅采用单个移动数据集分析无法得到的。

实施方案

[0071] 下面结合说明书附图对本发明的技术方案作进一步说明。
[0072] 如图1所示,本发明采用的技术方案如下:
[0073] 步骤1:获取出租车数据集、公共自行车数据集,POI数据集,并对数据进行预处理。
[0074] 步骤1.1:获取出租车数据集,将它们存储在数据库中。一条出租车轨迹记录TRTAXI表示如下:
[0075] TRTAXI=(pLong,pLat,pTime,dLong,dLat,dTime)
[0076] 其中pLong和pLat为上车地点的经度和纬度。dLong和dLat为下车地点的经度和纬度。pTime和dTime为上车时间和下车时间。
[0077] 步骤1.2:获取公共自行车数据集,包括轨迹记录和站点记录,将它们存储在数据库中。一条自行车轨迹记录TRPBS表示如下:
[0078] TRPBS=(leaseStation,leaseTime,returnStation,returnTime)
[0079] 其中leaseStation和returnStation表示借车站点和还车站点,leaseTime和returnTime表示借车时间和还车时间。
[0080] 站点记录stationRec包含了站点相关的信息,表示如下:
[0081] stationRec=[stationID,stationName,stationLong,stationLat]
[0082] 其中stationID为站点ID,stationName为站点名称,stationLong和stationLat为站点的经度和纬度。
[0083] 步骤1.3:以统一的形式表示出租车数据集和公共自行车数据集。采用TRAbs=(DLoc,Ddate,Dhour,ALoc,Adate,Ahour)表示抽象后的移动数据集。其中DLoc和ALoc表示出发和到达的位置。Ddate和Adate表示出发和到达的日期,Dhour和Ahour表示出发和到达的小时。对于公共自行车数据来说,DLoc为借车站点(leaseStation)的经纬度,ALoc为还车站点(returnStation)的经纬度。Ddate/Adate为借车日期/还车日期,Dhour/Ahour为借车小时/还车小时,它们可以从leaseTime、returnTime中提取得到。对于出租车数据来说,DLoc为上车地点的经纬度,即(pLong,pLat)。ALoc为下车地点的经纬度,即(dLong,dLat)。Ddate/Adate为上车日期/下车日期,Dhour/Ahour为上车小时/下车小时,它们可以从pTime、dTime中提取得到。
[0084] 步骤1.4:获取基于Foursquare的POI数据集,将它们存储在数据库中。每一条签到记录checkinRec表示如下:
[0085] checkinRec=[venueID,locName,locLong,locLat,checkinTime]
[0086] 其中venueID表示签到地点所属的POI类别,locName表示签到地点的名称,locLong和locLat表示签到地点的经纬度,checkinTime为签到时间。一共包含10种POI类别,包括:Food,Shop&Service,Outdoors&Recreation,Arts&Entertainment,College&University,Professional&Other Places,Nightlife Spot,Travel&Transport,Residence,Event。由于与类别“food”相关的位置既存在于居民区、工作区,也存在于娱乐区、夜生活区。这个类别无法辅助区域功能的判断,因此将这个类别删除,最终得到9个类别。
[0087] 步骤2:划分时间段,将城市分割为区域,根据时间和区域划分结果,对数据进行聚合。
[0088] 步骤2.1:对分析的时间段按小时划分。
[0089] 步骤2.2:根据城市道路路网,将城市空间划分为N个区域。
[0090] 步骤2.3:为了挖掘人群出行周期性的规律,以周为单位对TRAbs进行聚合。时间长度T定义为T={t1,t2,...,tN},N=168,表示一周中的168个小时(从周一到周日)。将所有TRAbs记录投影到一周内,获得TRSum。举例来说,当T=0时,表示将TRAbs中所有满足Ddate为周一,且DHour='0'的记录都聚合。TRSum=(hour,DLoc,ALoc,num),表示在一周中的第[hour,hour+1]个小时内共有num人从DLoc出发到达ALoc,hour=0,...,167。
[0091] 步骤2.4根据区域划分结果,将每条checkinRec根据签到地点划分到相关区域,计算每个区域中每种POI类别的占比:
[0092]
[0093] 其中pij表示第i个区域中第j种POI类别所占的比例。checkinsij表示在区域i中第j种POI类别的签到总数。cn表示POI类别数,由于共有9个POI类别,因此cn=9。
[0094] 步骤3:对于出租车和公共自行车数据分别构建三维张量。
[0095] 对出租车数据和公共自行车数据分别构建三维张量,用 表示。 表示中所有的元素都是非负值。的三个维度分别代表N个区域,F个特征和T个时间间隔。时间维度T为一周的168个小时。特征维度记录了每个区域进入和流出的流量值。由于共有N个区域,因此特征维度F=2N。前N个特征代表从一个特定区域出发前往其他区域的流量值。后N个特征代表从其他区域进入当前区域的流量值。张量的每个元素 表示区域i的第j个特征在第k个小时的值。具体来说,对于区域i, 表示从区域i出发到达区域j在第k个小时的流量值, 表示从区域j出发到达区域i在第k个小时的流量值,这些值可以从TRSum中得到。
[0096] 步骤4:采用非负张量分解方法分解三维张量,自动计算得到潜在的出行特征。
[0097] 采用基于PARAFAC的非负张量分解方法来提取潜在的出行特征,将张量 分解为一系列一阶张量的线性组合:
[0098]
[0099] 其中R为张量的秩,对应于期望得到的出行模式数。矩阵A,B,C为张量 分解后得到的三个因子矩阵。 A,B,C的列为ar,br,cr。符号 表示向量的外积。张量 的每个元素可以被写为:
[0100]
[0101] 其中Air表示区域i对于第r种出行模式的空间重要性。Ckr表示第k个小时对于第r种出行模式的时间重要性。Bjr表示第j个特征在第r种出行模式中的强度。张量分解结果包含了一系列可解释的时空模式。
[0102] 步骤5:基于张量分解结果,设计全局视图,包括时间图和热力图,展示每个移动数据集的时间和空间特征。
[0103] 步骤5.1:设计时间图。时间图采用折线图来呈现从因子矩阵C中衍生得到的每种出行模式的时域变化趋势。时间图的x轴对应于一周内的168个小时,y轴表示时间重要性。每一条折线的值为矩阵C中的每一列,对应于一种出行模式。折线的数量和张量的秩R一致。
[0104] 步骤5.2:设计热力图。热力图展示了从因子矩阵A中衍生得到的空间重要性。共有R张热力图,呈现了在每种出行模式下不同区域的空间重要性。矩阵A的每一列对应于一张热力图。对于一张热力图来说,每个区域用一种灰度绘制。区域的灰度正比于空间重要性值Air,反映了区域i对于第r种出行模式的重要性。采用灰度映射机制编码空间重要性值。灰度深的区域表示该区域对于当前模式十分重要,而灰度浅区域表示该区域对于当前模式不太重要。
[0105] 步骤6:设计区域视图,包含POI‑mobility图、流量图和区域POI分布图,可视化热力图中某个选定区域的多源出行模式和POI信息间的关联性。
[0106] 步骤6.1:设计POI‑mobility图。POI‑mobility图以紧凑的形式同时展示了多源出行模式和POI占比情况。中间的饼图表示区域内的POI占比。对于第i个区域,对所有的POI类别所占比例pij(j=1,...,cn)降序排列,根据pij的大小将饼图划分为扇区,每个扇区的大小正比于pij的大小。根据pij的值沿着y轴以顺时针方向从大到小依次绘制扇区。使用一种灰度深浅代表一个POI类别,在POI‑mobility图的右边显示POI图例。区域中人群出行模式的时间变化通过两个圆环以放射状的形式排放在外圈。最外圈代表使用出租车的出行模式,内圈代表使用自行车的出行模式。圆环被划分为7个扇区,表示一周中的七天。每个圆环上都有两条曲线,代表一周每个小时内该区域中人群的进入量和流出量。
[0107] 步骤6.2:设计流量图。分析者可以通过观察POI‑mobility图中采用不同交通工具出行的高峰期,通过设置约束条件,得到使用某一种交通工具出行的流量图。流量图展示了从当前区域出发或者终止到当前区域的详细的流动信息。流量图支持设置多种约束条件,包括出行模式约束、时间约束和流量约束。出行模式约束指分析者可以选择查看使用自行车还是出租车出行的情况。时间约束包括选择分析时间段、选择日期类型(工作日、周末),选择小时的范围。流量约束指分析者可以输入一个阈值,流量值小于该阈值的轨迹将被忽略。基于定义好的约束条件,流量图通过地图呈现所有满足条件的轨迹。地图上的点表示一个位置。对于自行车数据来说,它对应于区域中的一个站点。由于出租车的上下车点散布于整个区域中,进一步将区域划分为400m*400m的网格,根据网格对出租车轨迹进行聚合。因此,对于出租车数据来说,点代表网格中心。带有箭头的弧线表示位置之间的流量。流量的大小根据弧线的粗细和灰度深浅双编码。采用和热力图一样的渐变灰度映射机制,一条深色的粗线表示两个位置之间的流量很大,一条浅色的细线则表示两个位置之间的流量较小。
[0108] 步骤6.3:设计区域POI分布图。区域POI分布图在地图上绘制了区域中所有的签到地点。其中一个圆点表示一个签到位置,圆点的位置由签到地点的经纬度所确定,圆点的深浅和POI图例一致,圆点的大小正比于该地点的签到总数。
[0109] 步骤7:设计位置视图,包括位置POI占比图和位置POI分布图,直观展示每个位置周围的POI信息。
[0110] 当点击流量图上的一个点时,会更新位置视图。
[0111] 对于自行车数据来说,当点击一个点时就选择了一个站点。该位置对应的POI信息包含以该站点为中心、半径为radius的圆形中所有的POI。圆形的半径radius可以由分析者来修改。位置POI占比图展示了圆形范围内各种POI类别的占比情况。位置POI分布图绘制了圆形范围内所有的POI,其中所选的站点由一个五角星表示,一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数。当点击这个圆点时,将显示对应签到地点的名称和签到总数。
[0112] 对于出租车数据,点表示网格中心。位置POI占比图展示了网格中各种POI类别的占比。位置POI分布图绘制出网格中所有的POI,绘制方式和自行车数据类似,网格中的一个签到地点由一个圆点表示,圆点深浅和POI图例一致,圆点大小正比于该地点的签到总数。当点击这个圆点时,将显示对应签到地点的名称和签到总数。
[0113] 图2(a)至图2(f)为纽约出租车数据5种模式下的全局视图。图2(a)为时间图,从中可以发现模式3在工作日具有明显的早高峰。模式2在一周内的夜间都有使用高峰,周五和周六晚上的高峰尤为明显。模式4在工作日的8点到15点流量较高,在周末的11点到22点流量较高。模式1和模式5的晚高峰都出现在19点左右,模式5的峰值大于模式1。图2(b)‑图2(f)展示了5个模式对应的热力图,从中可以发现对每个模式最重要的区域。
[0114] 图3(a)至图3(e)为纽约公共自行车数据4种模式下的全局视图。模式4在工作日具有早晚高峰。模式2具有明显的早高峰。模式1和模式3具有明显的晚高峰,模式3的峰值高于模式1。图3(b)‑图3(e)展示了4种模式对应的热力图。
[0115] 图4为区域231的出行情况分析。从热力图(图2(d)(e)(f)和图3(c)(d))中发现,区域231对于使用出租车和自行车出行都是一个非常重要的区域,因为它在多种模式下都有很高的空间重要性。因此观察POI‑mobility图(图4(a)),该区域中占比最高的两个POI类别是‘Travel&Transport’和‘Professional&Other Places’。两种出行方式的高峰期都出现在工作日。对于自行车数据来说,在7点到8点有到达早高峰,在16点到17点有出发晚高峰。对于出租车数据来说,到达早高峰同样出现在7点到8点。出发晚高峰出现在20点到22点,峰值比出租车早高峰略小,出现时间比自行车晚高峰晚4个小时。
[0116] 进一步查看自行车数据的流量图,基于流量约束过滤掉不重要的轨迹。在早高峰期间(图4(b)),热门的到达站点为4318和352。从位置视图中可以发现,在站点4318附近有一个火车站签到数量极大。该车站是纽约中央车站,纽约最繁忙的交通枢纽。在站点352周围,热门的签到地点是健身房和办公楼。在晚高峰期间(图4(c)),热门的出发地为位于火车站周围的4318站点,最大的流量前往492和477站点。从这两个站点的位置POI占比图中可以发现,周围有商店和交通设施。
[0117] 图4(d)和图4(e)展示了早晚高峰期间使用出租车的流量情况,轨迹遍布于整个区域中。在早高峰期间,两个网格非常热门。网格1包含了纽约中央车站,网格2包含了很多办公楼和商店。在晚高峰期间,大量的流量都集中于纽约中央车站附近。
[0118] 总的来说,该区域对于两种出行方式在工作日都具有明显的到达早高峰和出发晚高峰。早上热门的到达地点位于火车站和工作地附近,晚上的出发流量大多始于火车站附近。出租车轨迹具有更长的距离。从中可以总结得到,该区域主要的功能是作为工作地点和交通枢纽。人们采用自行车和出租车出行的目的相似,都是用于日常通勤。但是当出行距离更长时,人们更倾向于选择出租车。

附图说明

[0054] 图1为可视分析视图的交互流程。
[0055] 图2(a)为纽约出租车时间重要关系图;
[0056] 图2(b)为纽约出租车数据模式1的全局视图;
[0057] 图2(c)为纽约出租车数据模式2的全局视图;
[0058] 图2(d)为纽约出租车数据模式3的全局视图;
[0059] 图2(e)为纽约出租车数据模式4的全局视图;
[0060] 图2(f)为纽约出租车数据模式5的全局视图;
[0061] 图3(a)为纽约公共自行车时间重要关系图;
[0062] 图3(b)为纽约公共自行车数据模式1的全局视图;
[0063] 图3(c)为纽约公共自行车数据模式2的全局视图;
[0064] 图3(d)为纽约公共自行车数据模式3的全局视图;
[0065] 图3(e)为纽约公共自行车数据模式4的全局视图;
[0066] 图4(a)为区域231POI‑mobility图;
[0067] 图4(b)区域231自行车早高峰(7点‑8点)出行情况图;
[0068] 图4(c)区域231自行车晚高峰(16点‑17点)出行情况图;
[0069] 图4(d)区域231出租车早高峰(7点‑8点)出行情况图;
[0070] 图4(e)区域231出租车晚高峰(20点‑22点)出行情况图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号