Jerryhuang的个人博客分享 http://blog.sciencenet.cn/u/Jerryhuang

博文

郭教授“时空数据挖掘”主题报告学习心得

已有 7257 次阅读 2013-7-2 11:22 |系统分类:科研笔记| 学习心得

郭教授在报告中用VIS-STAMP对犯罪数据进行挖掘,从算法到结果的可视化都很适用做面模式的时空分析,突然觉得自己太孤陋寡闻了,这是我拍的照片。

为便于理解高维数据,我们把数据表示成数据立方体,如下图所示,包含了三个维度:1.空间上的(如福建各个地市)、2.时间维(如从2007年到2012年这个时间段)3.属性维(各种类型的案件数据)

 

每个特定空间对象(福州)有一个水平方向的切片,称为时间维的切片如图(b)。数据立方体中的每个格子对象包含一个特定的空间对象(如福州市),一个特定的时间维(如2012年),和特定的属性维度(各种类型的案件)。接下来分别看VIS-STAMP的各个模块:

1)SOM(Self Organizing Map)模块:

基本思路:借助于颜色映射的可视化方法,将SOM算法的分析结果进行可视化,来把握聚类数量。

人眼对低纬数据模式有快速的识别能力但对高纬数据却无能为力。SOM具有良好的空间拓扑保序特性,在映射过程中能够将高纬数据的拓扑分布较好的保留到低纬空间中。并借助人眼对低维模式识别能力来提高聚类算法的效率。SOM集成了基于欧式距离的Kmeans算法跟神经网络算法。(详见: 杨黎刚, 苏宏业等.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136)

 

2)S-T Matrax模块:

横轴表示时间,如2007~2012年,纵轴表示不同地区,如福州市各派出所所管的辖区。

 

3)PCP(Parallel Coordinate Plot )模块:

 

横轴表示不同案件类型,如“盗窃”、“抢劫”、“杀人”、“绑架”等。纵轴表示该案件在该地区的百分比(几类案件百分比加起来是100%)。此图相当于“图例”。

 

4)MapMatrix模块:

即聚类分析结果,对不同年份的聚类结果进行直观比较。

 

个人研究进展:目前已经下载了VIS-STAMP软件及实验数据,实验效果挺理想的。正考虑应用到福州的区域犯罪分析上,VIS-STAMP的分析是基于面模式的,现在问题的关键是,没有福州各派出所管辖区的区划图,如果有各管辖区的区划图,可以用案事件点与区划图关联,将该案件数量赋予该辖区,那每个辖区(spatial object)就可以做得像上图的每个格子那样,进行福州市各派出所辖区的犯罪时空与多元模式分析了。

另外要提一下“赵辉. 基于SOM的可视化聚类研究[D].南开大学2007”这篇文章,该论文从两条主线(聚类与可视化)进行研究,提出了可视化聚类方法,该论文对我理解郭老师的研究、做犯罪数据挖掘与可视化有很大帮助。

 

 

   



https://blog.sciencenet.cn/blog-743248-704552.html

上一篇:交通事故数据的时空分析
下一篇:八月心得体会
收藏 IP: 218.66.59.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 18:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部