||
郭教授在报告中用VIS-STAMP对犯罪数据进行挖掘,从算法到结果的可视化都很适用做面模式的时空分析,突然觉得自己太孤陋寡闻了,这是我拍的照片。
为便于理解高维数据,我们把数据表示成数据立方体,如下图所示,包含了三个维度:1.空间上的(如福建各个地市)、2.时间维(如从2007年到2012年这个时间段)3.属性维(各种类型的案件数据)
每个特定空间对象(福州)有一个水平方向的切片,称为时间维的切片如图(b)。数据立方体中的每个格子对象包含一个特定的空间对象(如福州市),一个特定的时间维(如2012年),和特定的属性维度(各种类型的案件)。接下来分别看VIS-STAMP的各个模块:
1)SOM(Self Organizing Map)模块:
基本思路:借助于颜色映射的可视化方法,将SOM算法的分析结果进行可视化,来把握聚类数量。
人眼对低纬数据模式有快速的识别能力但对高纬数据却无能为力。SOM具有良好的空间拓扑保序特性,在映射过程中能够将高纬数据的拓扑分布较好的保留到低纬空间中。并借助人眼对低维模式识别能力来提高聚类算法的效率。SOM集成了基于欧式距离的Kmeans算法跟神经网络算法。(详见: 杨黎刚, 苏宏业等.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136)
2)S-T Matrax模块:
横轴表示时间,如2007年~2012年,纵轴表示不同地区,如福州市各派出所所管的辖区。
3)PCP(Parallel Coordinate Plot )模块:
横轴表示不同案件类型,如“盗窃”、“抢劫”、“杀人”、“绑架”等。纵轴表示该案件在该地区的百分比(几类案件百分比加起来是100%)。此图相当于“图例”。
4)MapMatrix模块:
即聚类分析结果,对不同年份的聚类结果进行直观比较。
个人研究进展:目前已经下载了VIS-STAMP软件及实验数据,实验效果挺理想的。正考虑应用到福州的区域犯罪分析上,VIS-STAMP的分析是基于面模式的,现在问题的关键是,没有福州各派出所管辖区的区划图,如果有各管辖区的区划图,可以用案事件点与区划图关联,将该案件数量赋予该辖区,那每个辖区(spatial object)就可以做得像上图的每个格子那样,进行福州市各派出所辖区的犯罪时空与多元模式分析了。
另外要提一下“赵辉. 基于SOM的可视化聚类研究[D].南开大学2007”这篇文章,该论文从两条主线(聚类与可视化)进行研究,提出了可视化聚类方法,该论文对我理解郭老师的研究、做犯罪数据挖掘与可视化有很大帮助。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-17 18:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社