数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

城市计算与轨迹数据挖掘——“大数据与智能决策”讨论班

已有 3746 次阅读 2020-1-14 10:27 |个人分类:科研笔记|系统分类:科研笔记

城市计算

城市计算是一个交叉学科,它以城市为背景,是计算机科学、城市规划、交通、能源、环境、社会学、管理学和经济学等多个学科融合的新兴领域。城市计算通过不断获取、整合和分析城市中多源异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)。

image.png

图1 城市计算的基本框架

城市计算将无处不在的感知技术、高效的数据管理和分析算法,以及新颖的可视化技术相结合,致力于提高人们的生活品质、保护环境和促进城市运转效率。城市计算帮助我们理解各种城市现象的本质,甚至预测城市的未来。轨迹数据挖掘是城市计算框架中的一部分,下面介绍一下2015年郑宇博士撰写的文献综述。

轨迹数据挖掘综述

文献:Yu Zheng. Trajectory Data Mining: An Overview. ACM Transaction on Intelligent Systems and Technology. 2015, 6(3): 1-41.

随着位置采集技术和移动计算技术的进步,空间中人、车和动物等移动物体产生了大量的空间轨迹数据。文章对轨迹数据挖掘领域中的新兴技术做出了系统性的综述。

通常,一条空间轨迹可以在地理空间中表示为点的有序集合,p1→p2→…→pn,其中每一个点都由经纬度坐标和时间戳信息组成,p=(x,y,t)。空间轨迹数据可按照人、交通工具、动物以及自然现象等移动物体分为四类。

论文建立了轨迹数据挖掘的框架,明确了各项轨迹数据挖掘任务的定位,总结了各项任务的研究方法和应用,并提供了研究中的一部分公开数据集。

论文首先对用有序点集表示的空间轨迹建立了轨迹数据挖掘框架,如图2所示,轨迹数据挖掘任务主要包括:轨迹数据预处理、轨迹数据数据管理、轨迹不确定性处理、轨迹模式挖掘、轨迹分类和异常轨迹检测等。除此之外,空间轨迹也可以表示为其他形式,例如矩阵、张量、图等,并采用对应的数据挖掘技术进行处理。

image.png

图2 轨迹数据挖掘框架

由于轨迹数据具有采样频率差异性、数据质量差等特点,所以当我们获取了轨迹数据之后,首先要进行的是轨迹数据预处理。轨迹预处理包括五个步骤:噪声过滤、停留点检测、轨迹压缩、轨迹划分和地图匹配。其中,噪声过滤使用的方法有均值过滤/中位数过滤,卡尔曼滤波/粒子滤波以及基于启发式的异常点检测;停留点分为静止不动和区域徘徊两种,检测的方法采用基于启发式的算法;轨迹压缩可以分为离线压缩和在线压缩,使用的方法有Douglas-Peucker算法和滑动窗口算法;轨迹划分使用的方法有基于时间间隔的划分,基于轨迹形状的划分和轨迹中语义信息的划分;地图匹配是指将经纬度坐标转换成路段信息的过程,使用的方法有局部匹配、全局匹配和综合匹配方法。

轨迹数据管理,包括轨迹的索引与检索和轨迹相似性的计算。其中,轨迹的索引与检索使用的方法有范围查询和最近邻查询;轨迹相似性度量的方法分为点线距离,线线距离和轨迹段之间的距离三类。

轨迹不确定性处理,分为两种情况,分别是对轨迹中不确定信息的补全和对过于详细信息的隐私保护。在补全轨迹信息的过程中,对于有路网形状限制的轨迹数据,可以通过利用与之相似的轨迹数据进行交互补全;对于无路网形状限制的轨迹,可在建立轨迹网格后依据查询点补全其路线。出于保护用户隐私的目的,我们需要对信息中过于详细的部分进行隐私化。

随后,文章介绍了轨迹数据挖掘的具体应用,分别是轨迹模式挖掘、轨迹分类和异常轨迹检测。

轨迹模式包括多条轨迹的共同出行模式、时序模式和周期模式。轨迹分类是指将一条轨迹分段,并为每个轨迹段标注对应的语义信息,从而提升轨迹的应用能力。异常轨迹监测分为两类,一类是通过聚类算法从一系列轨迹中区分出异常轨迹,另一类是通过对比已有的轨迹挖掘模式检测异常事件。

最后,作者公开了在轨迹挖掘任务中使用的一部分数据集,包括Geolife项目数据集,T-Drive项目数据集以及动物移动和自然现象的数据集等。

备注:2019年11月12日晚上,“糖果之家”相约星期二,“大数据与智能决策”讨论班(Seminar)继续开讲,本次讨论班以“城市计算与轨迹数据挖掘”为题,共讨论了一篇文献,由博士生进行讲解,共有青年教师、博士后、博士生和硕士生20人参加。




https://blog.sciencenet.cn/blog-34250-1214166.html

上一篇:多准则决策分析与多准则分类问题——“大数据与智能决策”讨论班
下一篇:基于深度学习的患者再入院风险预测——“大数据与智能决策”讨论班
收藏 IP: 202.118.103.*| 热度|

1 武夷山

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 17:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部