本文摘要:[摘要]基于手机信令数据识别景区游客,精准分析游客的出行行为特性,是景区实施客流预警和管控方案,提升客流体验的前提条件。基于手机信令数据的特性分析,考虑景区边界与基站服务范围的空间重叠关系以及景区出入口的特殊性,将基站分为三类,提出景区研究
[摘要]基于手机信令数据识别景区游客,精准分析游客的出行行为特性,是景区实施客流预警和管控方案,提升客流体验的前提条件。基于手机信令数据的特性分析,考虑景区边界与基站服务范围的空间重叠关系以及景区出入口的特殊性,将基站分为三类,提出景区研究范围确定方法;将用户分为居民、工作人员、路人及游客四类,构建基于出行链的游客识别模型,分析不同类型用户的出行特征,并以颐和园景区为例开展实证。研究结果显示,采用基于出行链的游客识别方法识别颐和园景区游客103966人次,识别精度为97.56%,高于基于停留时间的客流识别方法。研究可为精准识别景区游客,实时预测游客流量,制定并实施客流调控方案提供重要的理论基础。
[关键词]交通工程;游客识别模型;手机信令数据;出行链;停留时间
前言在节假日等旅游高峰期,部分热门景区(点)大量游客聚集而形成区域拥堵,对游客体验、安全和景区管理产生较大影响,急需精准识别景区内不同区域或景点的游客,实时预测预警游客流量,实施分流和限流[1-3]等客流调控方案。游客客流采集数据有视频数据、闸机刷卡数据、RIDF数据、人工统计数据等,多为景区整体客流数据,无法准确获取景区某些局部区域或者某热门景点的客流量,数据实时性较差,无法满足实时客流预测预警的要求[4]。
手机信令数据具有覆盖面全、实时性高等优势[5-6],被广泛用于游客的识别与出行特性分析。手机信令数据是由手机终端和手机基站间联系时生成的数据,景区的边界与基站服务边界通常不完全重合,服务于景区及其周边的基站用户包含游客和非游客,不少学者开展了基于手机信令数据的游客识别方法研究,提出用停留时间等指标差异进行用户分类。
杨东[7]和LI[8]将景区基站服务用户分为游客与非游客两类,前者以8小时为长白山景区内游客平均停留时间阈值,后者以8-18点内的停留时间在0.5至5小时内为阈值,区分游客与非游客。龙奋杰[9]将用户分为园区工作者、路人及游客3类,假设在景区基站停留时间不超过0.5小时的用户为路人;一周内出现5天以上且每天停留时间超过5小时的用户为园区工作者,其余为游客,校验结果显示精度达到80%左右。
Zhai[10]先将至少2次经过出入口基站的用户筛选为潜在游客,再根据用户停留时间(1至6小时)和连接景区基站的时间占比(超过90%)两个指标识别游客。方家[11]和陈圣威[12]将用户分为路人、居民、工作人员以及游客4类,方家假定0至5点手机为关机状态的用户为居民。陈圣威根据用户多日凌晨、工作时间内在研究区域的停留时长,识别用户的工作地与居住地,筛选并剔除在景区周边居住或工作的用户,根据景区面积设置停留时间的阈值为1至3小时,识别游客,精度达到75%左右。
已有研究多用单一指标景点停留时间进行用户分类,问题在于不同类型用户在不同景点的停留时间的阈值不同,且当用户分为路人、居民、工作人员以及游客4类时,短时游览的游客与路人特性、长时间游览的游客与工作人员的停留时间接近,导致游客的识别精度为60%-80%[9,12]。为解决上述问题,论文提出基于手机信令数据提取出行者的出行链,分析游客与非游客(工作人员、路人)一日、多日或者更长时间内(工作日、假日)的出行链时空特性差异,修正现有游客识别方法,以提高识别精度,为不同景区游客停留时间阈值和后续景区局部客流预测预警提供数据支持。
1手机信令数据特点及应用
手机信令数据是由手机终端和手机基站间联系时生成的数据。当用户在某个基站内进行通话、短信、开关机等事件时,事件会被该基站记录,并生成一条数据。当用户进行基站间移动时,会自动切换连接的基站,同时生成一条数据。因此用户接打电话、开关机或进行较大范围移动时,均会生成信令数据[13]。手机信令数据主要包含国际移动用户识别码(IMSI,InternationalMobileSubscriberIdentity)、时间(TIME)、基站编号(CELLID)、基站经度(LONGITUDE)及基站纬度(LATITUDE)5类信息。
对于不同应用场景,不同的数据适用程度不同。以景区为例,对于景区的整体客流量数据获取来说,通过门禁的统计数据可以准确的得到景区内不同时段的入园人数、在园人数等整体数据,但对于景区内不同区域、不同景点的客流分布情况却无法准确及时的获取;对景区内较小的室内景点来说,视频识别数据可以简单的获取到室内的客流量、密度及分布情况,对于室内区域的客流情况可以快速做出识别与分析,但该技术在室外的效果会受到天气、建筑遮挡等多种因素的影响,造成精度不足的问题;传统的人工计数方式可以解决前面两类技术存在的问题,可以通过增加调查人员获取景区不同区域、不同景点的客流量、密度、分布等数据,但数据采集成本高、实时性低,对于景区短时预测预警及景区管控等参考价值有限。
手机信令数据具有覆盖范围广、定位速度快、实时性强、连续性强等特点。结合数据的连续性,对客流进行连续的追踪与分析,因此多用于城市内多个景区间的客流特征分析及挖掘[14-18]。并且根据景区类型的不同,可以通过手机信令数据,实时获取景区内不同区域的客流分布数据,针对景区内不同区域的客流量、分布情况、客流特征及出行特点进行提取与分析。
2基于出行链的游客识别方法
2.1景区游客识别考虑的因素
景区游客识别中需要考虑游客的停留时间、出行轨迹等出行的因素,以及景区的类型、景区大小、景区位置、景区周边用地性质及道路情况等景区的因素,两部分。出行因素中,主要考虑游客在景区研究范围内的停留时间,以及出行轨迹是否经过景区范围。景区因素中,首先旅游景区分为开放型与封闭型两种,开放型是没有面积和空间限制、免费、且游客流动性更大不易管控的一类景区[19],封闭型是指有空间限制,通过一定的物理设施隔离景区与外围的空间的一类景区。
研究中提出的识别方法适用于设有出入口的封闭式景区。不同景区的覆盖面积大小不同、所处位置有所差异、且不同的地理地貌均会对游客识别造成影响,因此选择手机基站为最小单位,进行游客数据的识别。大型景区内包含的基站数会较多,单个基站面积较大;小型景区基站数较少,单个基站面积较小。基站较多的景区中,基站在游客识别中的作用也会有所差异,需要根据功能和位置进行分类以保证识别精度。同时,景区周边的用地性质、路网特征也会对景区游客识别产生干扰。
当景区周边存在居住用地、商业用地和工作用地等,用户类型就会出现居民、路人和周边工作人员等;当景区周边路网较为密集时,周边路人的比例也会提升。因此景区的游客识别中,需要将基站进行分类,根据特定的基站选定研究区域,以保证识别方法适用于不同面积和位置的景区;需要将用户进行分类,保证识别方法可以将游客与居民、路人和周边工作人员进行区分,保证识别精度。
2.2基站分类与研究区域选取
景区内部及周边设置了一定数量的基站为景区用户服务,手机基站受到周边环境干扰、基站空间分布以及基站信号强度等影响,服务范围不规则,通常采用泰森多边形的方法表示基站的实际服务范围[20]。
可以发现基站服务范围通常略大于景区的物理边界。根据景区边界与基站服务范围的空间重叠关系,并考虑到游客均通过景区出入口进出,景区出入口基站具有特殊性,将景区基站分为三类,第一类为覆盖景区出入口的基站;第二类为完全处于景区边界内的基站;第三类为与景区有部分重叠的基站。为获取全部游客数据,选取第一、二和三类基站覆盖的范围作为景区研究区域。
2.3用户分类及特征
景区研究区域内的手机用户有游客和非游客,非游客包括景区周边的居民、工作人员和经过景区周边道路的路人。研究将景区研究范围内的用户分为4类:路人、居民、工作人员以及游客。
(1)居民:具有固定的居住地,即凌晨至早上、或晚间时段内,具有固定停留点,停留时间超过一定的时间阈值。居民数据一定出现在第三类基站,可能出现在第二类基站。现有研究多将凌晨0:00-5:00停留时间大于4小时的景区研究区域内用户认定为居民[11]。
(2)周边工作人员:具有固定的工作地点,即连续几天出现在同一地点,在工作地累计停留时间超过一定的时间阈值。工作人员一定不会出现在第二类基站,可能出现在第一类和第三类基站。我国工作时间多为:8:00-17:00,根据《2016-2017年中国休闲发展报告》(休闲绿皮书)中数据,2016年北京市居民工作时长约为6小时2分钟/天,现有研究将9:00-16:00时段内累计停留时间超过5小时的用户识别为工作人员。
(3)游客:在研究区域停留时间超过一定的时间阈值,不会连续几天出现在研究区域,出行目的地较多。游客经景区出入口进出景区,因此一定出现在第一类基站,可能出现在第二类和第三类基站。(4)路人:在景区覆盖范围内没有固定的驻留地点,在研究区域内的总停留时间短于其他类型用户。路人一定不会出现在第二类基站,可能出现在第一类和第三类基站。
2.4基于出行链的游客识别方法
路人、居民、工作人员和游客在空间分布特性上存在一定重叠。如何应用手机信令数据进行游客的识别,成为景区客流预测的重要环节。
2.4.1不同用户的出行特征
手机信令数据中包含了表示手机用户所在位置的经纬度坐标,以及用户出现在该坐标下的时刻。基于这两类数据,将用户出行的时间与空间数据进行整合,得到按时间顺序排列的用户全天的出行轨迹,即出行链。游客出行链是游客以旅游为目的,从出发至到达景区目的地,以及从当前景区目的地至下一目的地的出行全过程。基于游客出行链的时空分布特性,研究基于4类用户的出行链特性分析,提出基于出行链的游客识别和特征分析方法。基于手机信令数据,进行数据预处理后,提取用户的出行链[21-24],绘制用户的出行链。
(1)居民用户出行链特征:居民的多日出行链起讫点具有较强的规律性,出行起讫点均在研究区域内,凌晨至早上在区域内没有移动。当出行链包含多个活动点时,通常离开研究区域,并在中午或晚上返回研究区域内的居住地,凌晨停留时间较长。(2)工作人员出行链特征:出行起点在研究区域外,进入研究区域后,在工作时间内、景区外围基站有固定的停留地点,最后离开研究区域,工作时间段内停留时间较长。
(3)路人出行特征:出行起点在研究区域外,进入研究区域后,沿研究区域外围边界移动,没有长时间停留点,最后离开研究区域,总停留时间较短。(4)游客出行特征:出行起点在研究区域外,在开园时间段内,由景区出入口基站进入研究区域,且在研究区域内有多处停留时间较长的地点,最后经过景区出入口基站离开研究区域,总停留时间较长。
3案例分析
3.1研究区域
3.1.1景区及手机信令数据简介颐和园位于北京市西郊,是国家5A级旅游景区,中国清朝时期皇家园林,自然风光优美秀丽,节假日期间会吸引国内外众多游客前往游览,是我国最热门的景区之一。颐和园占地面积大,不同区域的热门程度不同,在节假日期间会形成明显的客流分布不均的现象。同时,颐和园周边基站布置较为密集,因此,选取颐和园为研究对象,开展基于手机信令数据的游客识别案例分析具有典型意义。手机信令数据来自北京移动公司某年5月1日0时至5月3日24时的全部数据,划分研究区域,基于手机信令数据提取出行链,开展基于出行链的游客识别和出行特性研究。
3.1.2研究区域选取使用ARCGIS软件,绘制每个基站的泰森多边形,使用泰森多边形表示该基站的服务范围,并将多边形范围与颐和园景区范围进行比较,选取相交以及包含关系的基站,即选择可以覆盖颐和园景区的多边形所在的基站作为颐和园景区的研究区域。颐和园景区研究区域共设有13个基站。为方便后续研究,将基站重新编号。
地理教育论文投稿刊物:地理学报于1934年创刊,由中国科学院主管,刊登的主要内容包括能反映地理学科最高学术水平的最新研究成果,地理学与相关学科的综合研究进展,地理学各分支学科研究前沿理论,与国民经济密切相关并有较大应用价值的地理科学论文。希望地理学相关人员积极向杂志投稿。
4结论
研究基于手机信令数据,对景区的客流识别方法进行研究,根据景区边界与基站服务范围的空间重叠关系,考虑游客通过景区出入口进出景区而产生的出入口基站的特殊性,将景区基站分为三类,第一类为覆盖景区出入口的基站;第二类为完全处于景区边界内的基站;第三类为与景区有部分重叠的基站,选定了景区的研究区域。将用户分为居民、工作人员、路人以及游客4类,分析不同用户的出行特征,提取用户出行链,提出基于出行链的游客识别方法,最后以北京市颐和园景区为例进行案例分析,得到五一期间共识别游客103966人次,游客识别准确率达到97.56%,识别精度较高。结果显示,识别方法对于如颐和园占地面积较大的自然类景区有较好的识别精度。研究提出的游客识别方法可以用于大型自然类景区的客流统计,为景区的客流分布及移动等研究提供数据支持,给景区管理员进行大客流预警调控提供参考。
[参考文献]
[1]韩艳,杨光,武鑫森,等.考虑游客拥挤感知的旅游线路优化设计[J].北京工业大学学报,2018,44(12):1537-1546.
[2]HANYan,YANGGuang,ZHANGTinatina.Spatial-temporalresponsepatternsoftouristflowunderentrancetouristflowcontrolscheme[J].TourismManagement,2021,83,10.1016/j.tourman.2020.104246.
[3]MOShumin,ZENGKefeng,LIUChao.Earlywarningmechanismofhuangshanworldgeoparktodivertpassengertraffic[J].AdvancedMaterialsResearch,2014,1030-1032:2014-2018.
[4]靳诚,徐菁,黄震方,等.南京城市内部景点间游客流动特征分析[J].地理学报,2014,69(12):1858-1870.
作者:韩艳1,龚浩1
转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/27642.html