“
写在前面:
传统抽样调查往往是调查某个时段某类群体的个体属性和出行信息,难以确定个体的连续活动模式和活动特征。而利用大数据进行连续的特征追踪、动态观测和分析个体的空间活动特征成为可能。作者以广州市为例进行实证研究,梳理广州市第三次交通综合调查的框架和特点,从挖掘特殊指标、实现多源数据相互补充与校核两个层面探讨大数据在交通综合调查中的作用。
苏跃江
广州市交通运输研究所
高级工程师
引言
城市交通综合调查通常包括居民出行调查、公共交通调查、道路交通运行调查、交通基础设施盘点等内容,是掌握城市交通运行规律的基础性工作。发达国家大型城市一般每隔5年开展一次综合调查,中国北京、上海等城市从年开始均已形成5年一次大规模调查的工作机制,并在年均已完成第五次交通综合调查工作。广州市最近一次开展全市交通大调查是在年,距今已过去12年。期间,影响广州市交通运行的外部环境及内部因素均发生较大变化,与年相比,城市建成区面积增长68.4%,常住人口和就业人口增长均超过40%,中小客车保有量约为年的3.5倍,公共汽(电)车运营里程增长71%,地铁运营里程从35km拓展至km。城市空间结构和交通格局发生重大变化,进而导致居民出行规律、交通供需特征等变化显著,原有调查数据及结论已不能体现当前交通特性,难以有效指导交通工作。因此,亟须尽早启动新一轮交通综合调查工作,为交通规划、交通运营管理以及交通*策和战略等决策提供可靠依据。
大数据在交通领域的应用为交通信息采集、监测城市与交通系统的互动演变过程提供了重要的技术支持。本文基于大数据资源优势,充分发挥传统抽样调查与大数据的互补融合,并以广州市为案例进行实证研究。
传统抽样调查与
大数据挖掘的关系和差别
1
传统抽样调查与
大数据挖掘的关系
传统抽样调查与大数据挖掘的关系
居民空间活动包含社会经济、地理空间、交通方式、活动场所和行为模式等5个维度的属性特征。传统抽样调查(包含普查、访谈、问卷等)往往是调查某一天或某一个时段居民个体的属性和出行信息,基于调查信息统计样本的社会经济信息(职业、收入等)、地理空间(居住地、就业地等)、出行信息(出行量、出行OD、交通方式等)、行为模式信息(出行意愿、出行时间价值、购车意愿等)等来分析个体空间活动的属性特征,但很难确定连续和动态的空间活动特征。利用大数据连续的特征追踪和海量数据使观测个体的空间活动特征成为可能,利用手机信令数据和互联网位置数据监测居民的职住特征、利用GPS数据挖掘出租汽车乘客的空间活动特征、通过AFC数据挖掘轨道交通乘客的时空分布特征、利用互联网地图的路径规划数据挖掘不同区域通过道路网络及公共交通网络形成的交通可达性等均成为可能。结合传统抽样调查可以全面了解个体空间活动属性,从而为城市规划、城市治理等提供更精细化的数据支持。
传统抽样调查与大数据挖掘的差别
传统抽样调查基于问卷的定制设计,采取当面问询的方式采集信息,其优点是交通针对性强、采集信息准确。然而,由于调查成本和人力的限制(即使采用智能设备采集也只是手段),使得其样本量小、可重复性较弱,致使调查样本可靠性存在问题,例如居民出行调查中由于存在沉默需求导致出行率偏低和出行时间分布不可靠、由于母体(人口总量)的不确定性导致抽样无法做到均匀分布或随机分布等问题(见下表)。
传统抽样调查与大数据挖掘特点对比
大数据挖掘具有连续、动态、数据量大等特点,其优点是产生的数据样本量大,可以利用动态数据进行重复分析。但是,大数据为衍生产品并非交通定制数据,无法通过大数据获取相关群体的行为、心理等信息,并且大数据往往是局部对象的全样本,难以实现全对象关联,导致对城市现象揭示的片面性。很多数据挖掘分析需要假设条件才能确定,例如大多数城市由于票制*策一般只有公共交通IC卡上车刷卡信息,需要通过出行链假设推断用户下车和换乘车站;由于基站的密度和辐射范围,基于手机信令数据判断的位置为模糊地址,也无法判定出行方式、出行目的等;利用手机信令数据分析一次出行与传统抽样调查出行存在差别,大数据的算法更需要多种情景和敏感性测试,同时基本所有大数据都不是全样本,需要借助母体进行扩样。
城市交通综合调查演变
1
演变历程
北京市
年,北京市开展第一次交通综合调查工作,调查内容为7.2万户的居民出行,调查成果为北京市交通规划和建设管理服务并发挥重要的作用,首次利用调查数据分析了北京市居民的出行规律和时空分布,并开展公共交通线网的优化研究工作等。时隔14年之后于年开展第二次交通综合调查工作(之后每5年开展一次调查,并且从年开始每年开展一次小样本调查工作,见下图),调查涉及6.4万户居民出行、道路流量、公共汽(电)车等4大项11小项,调查成果用于诊断居民出行需求和城市交通拥堵问题,支持全市交通模型构建,为《北京交通发展纲要(—)》提供重要的数据支撑。年开展第三次调查工作,调查涉及居民出行、道路流量、轨道交通等6大项14小项,调查成果用于对北京市交通运行、管理和发展趋势进行全面、系统的总结和判断,为“十一五”综合交通规划、奥运交通保障措施、奥运后的交通行动计划、相关的交通*策评估等提供重要的数据支持。年开展第四次调查工作,调查涉及居民出行、公共交通等11大项16小项,调查成果用于对北京城市交通发展新趋势和特征进行全面系统的总结和判断,为制定“十二五”综合交通规划、缓解交通拥堵*策、《北京交通发展纲要(—年)》等提供重要的数据支持。年开展第五次交通综合调查工作,调查内容包含手机信令数据采集分析、居民出行调查、公共交通调查、道路流量调查、专项辅助调查、数据收集等6大项17小项,调查成果对支持城市总体规划修编、轨道交通规划和评估、京津冀都市圈一体化等提供重要的支持。
北京市和上海市历年交通综合调查概况
上海市
年,上海市开展了第一次交通综合调查工作,主要开展居民出行调查,调查成果用于第一轮上海市城市综合交通规划的编制,创建了上海市交通规划模型,在内环高架、杨浦大桥、延安路高架、地铁二号线等项目的论证工作中起到较大的作用。年和年分别开展第二次和第三次交通综合调查工作(之后每5年开展一次调查)。第二次调查成果对开展新一轮上海市城市总体规划、综合交通规划、轨道交通网络规划以及城市交通发展白皮书等研究发挥了重要的作用。第三次调查成果对开展上海市综合交通发展战略、“十一五”综合交通规划,支持长三角都市圈的交通规划以及世博会交通规划等起到积极作用。年开展了第四次交通综合调查工作,调查成果为“十二五”综合交通规划、综合交通模型二期开发、世博会交通保障方案、新一轮交通发展白皮书编制等提供重要数据支撑。年开展第五次交通综合调查工作,调查内容包含交通设施普查及资料收集、人员出行调查、车辆使用调查、系统运行情况调查、信息数据挖掘等5大项24小项,调查成果对支持城市总体规划、“十三五”综合交通规划等规划和决策支持提供重要的支撑。
广州市
年,广州市开展第一次交通调查,主要调查居民出行和车流量,利用调查数据构建城市交通模型,并在年和年开展了万户居民出行调查对交通模型进行修正。年,开展了第二次交通调查,调查成果从不同侧面反映居民出行需求,为研究交通演化规律,科学制定交通发展战略、*策、技术法规提供重要的支撑。在调查数据及结论的支撑下,“十一五”期间形成了丰富的交通规划研究成果,包括《广州市综合交通发展战略(—年)》《广州市综合交通体系规划(—年)》《广州市轨道交通线网规划(年)》《年广州亚运交通发展战略规划》等,对广州市交通发展做出巨大的贡献,为促进广州市社会经济的快速发展起到至关重要的作用。年9月,广州市开展第三次交通综合调查工作,包含人员出行调查、交通系统运行状况调查、信息数据挖掘三大板块。
2
演变特点
1)调查范围逐步扩大。
随着城镇化进程不断发展,居民的时空分布特征随着城市空间拓展而发生变化,这就要求调查范围逐步扩大,以全面了解居民的交通特征和出行需求。北京市调查范围从中心区到中心区+重点地区,再到全市直至京津冀区域,年第五次交通综合调查的范围扩大至京津冀城市群,覆盖北京市市域范围,重点范围为六环路以内,针对重点新城和边缘集团、重点镇。上海市调查范围从中心区到中心区+重点地区,再到全市,年第五次交通综合调查的范围扩大至全市。广州市调查范围从原八区建成区km2到市区(除增城和从化的10个区)km2,再到全市范围km2,年第三次交通综合调查范围为全市范围(见下图)。
广州市三次交通综合调查范围变化
2)调查内容逐渐增多。
北京、上海、广州3个城市分别经历了从最初的居民出行调查、查核线车流量调查逐渐发展到各种人员调查、各种交通方式调查、系统运行调查以及社会经济、就业岗位、土地利用的普查等。3个城市的调查项目数量分别实现从2项到17项、从6项到24项、从2项到15项的变化。
3)调查抽样率呈现逐步下降趋势。
调查抽样率北京市从第一次4.5%缩小至第五次0.8%,上海市从第一次2.0%缩小至第五次0.9%,广州市从第一次3%缩小至第三次1.8%(见下表)。
北京、上海、广州居民出行调查抽样率演变
4)新技术、新方法特别是交通大数据的使用。
北京市在第五次交通综合调查中利用GPS数据对居民出行及车辆出行调查进行校核,利用视频检测数据校核道路流量调查,利用IC卡数据挖掘和校核公共交通出行客流调查等。上海市在第五次交通综合调查中利用综合交通信息平台数据分析干路拥堵时空分布,利用遥感技术分析交通用地,利用手机信息校核居民出行特征,利用车辆牌照识别数据挖掘车辆OD,利用IC卡数据分析公共交通客流特征,利用GPS数据挖掘车辆出行特征等。广州市在第三次交通综合调查中,利用智能化终端设备取代纸质问卷,采用视频拍摄方式取代人工调查,利用车牌识别数据挖掘交通特征,利用IC卡数据挖掘公共交通出行特征和换乘特征,利用GPS数据挖掘出租汽车及货运车辆营运特征,利用互联网位置数据挖掘重要枢纽客流特征、典型建筑交通吸引特征、城市交通可达性,利用手机通信大数据挖掘职住分布、城际出行及轨道交通换乘特征等。
广州市第三次
交通综合调查框架和特点
1
调查框架
广州市年交通综合调查包含人员出行调查、交通系统运行状况调查、信息数据挖掘3大板块15小项:1)人员出行调查,包含居民出行、流动人口出行、枢纽问询3项调查;2)交通系统运行调查,目的是为调查提供抽样母体并对人员出行调查提供校核,包含人口就业、土地利用以及道路流量、轨道交通出行、公共汽(电)车出行等6项调查;3)信息数据挖掘,包含对公路交通信息、道路卡口车牌识别数据、公共交通IC卡数据、营运车辆GPS数据、互联网位置数据及手机通信数据等6方面的数据挖掘。本次调查采用大数据挖掘和传统交通调查并行模式(见下图),目的是充分利用现有信息化资源,提高调查数据的广度、精度及效率。
广州市第三次交通综合调查框架
2
调查特点
1)强有力的调查组织框架。
本次调查范围广、规模大、专业性强、需提供协助的部门多,因此调查工作采用市交通工作领导小组统筹、多个职能部门协助、专业机构提供技术支撑的组织形式,在市交通工作领导小组框架内,组建了市-区-街(镇)三级调查办公室。其中,市调查办公室设在市交通委员会,成员单位包括市交通委员会、公安局、民*局、统计局、教育局、旅游局、国土规划委员会以及各区*府,主要负责总体统筹工作,并委托第三方机构开展调查方案设计、调查培训等工作;区调查办公室设在各区*府,主要负责配合指导本区各街(镇)调查办公室工作;街(镇)调查办公室设在各区街(镇),主要负责组建调查队伍,并配合第三方机构开展具体的调查工作等。
2)充分利用相关部门既有统计资料。
通过相关部门固有的调查机制、日益完善的统计报表制度、手段多样的信息采集技术形成系统的统计资料,有助于降低调查的人力、物力和财力成本。本轮调查充分协调采用相关部门既有统计资料,包括:市统计局人口普查、经济普查以及1%人口抽样调查数据,市教育局就学统计数据,市旅游局旅游人口统计数据,市公安局机动车登记数据,广州地铁集团地铁运营统计数据以及市交通委员会公共交通运营统计数据等。
3)调查方案考虑不同数据关联。
在调查方案设计阶段考虑了不同数据之间的关联,并通过调查内容设计强化数据之间的联系,实现各个板块之间相互补充、校核,方便后续综合校核扩样工作(见下图)。
广州市第三次交通综合调查传统调查与大数据挖掘之间的关系
4)采用新技术替代传统人工调查,降低人工调查难度、提高调查效率。
人员出行信息采集采用智能化终端PDA设备取代纸质问卷,采用最新的地理信息数据库作为数据采集基础,系统在出行信息采集过程中实现了地址经纬度准确定位、自动逻辑纠错、数据及时上传、数据采集进度查看以及指标校核等功能,极大提高了调查效率、数据可靠性及后期数据的应用广度。车流量和载客率调查采用外业视频拍摄+内业软件计数及人工抽检的方式取代大规模人工外业调查,降低了人工调查实施难度,提高了安全性。轨道交通乘客出行调查在人工问询的基础上,高峰期采用