|
12.2 聚类
物以类聚,人以群分。这是大自然最重要的基本规律,也是我们认知大千世界的主要途径。
在2016年的Google I/O大会上,有许多关于Project Tango的展示,这一项目将利用AR技术改变你看世界的方式,比如为室内AR提供准确的导航,让用户在虚拟世界身临其境交互。看看视频演示:
http://toutiao.com/i6288079469181665794/
Project Tango对周围的环境和区域绘制,有个技术关键点---“聚类”。
聚类算法能够把图片中不同种类的物体分类,比如分清哪些像素代表桌子、椅子,哪些是人,哪里代表了墙。
如何在一大堆数据中抽象出有价值的信息,“聚类”常常不可或缺。
如果我们把图形中所有的要素看作一个集合,聚类就是根据像素的特性属性异同,把像素分割到一个个不同的子集。对不同子集的不同特性进行分类,然后分别处理之。
如果正确分类了不同特性的子集,就有望获知图像中隐含的最基本最宏观最框架的结构信息的意义。
比如,有了整体框架的信息,将很容易从二维图形中还原三维图像。
前面3.4节,我们提到过“空间折叠”现象是非常值得研究的。因为虽然折叠后的物体已经变形,但某些结构关系却仍然有痕迹。
我们有可能通过聚类手段,然后分析子类之间的关系,恢复出折叠之前的空间结构面貌:
以前,不少学者认为将二维平面图像还原到高纬度,只是天方夜谭神话。现在,这个神话在机器学习的处理下,已经变成了现实。
让我们直观地感受下聚类算法的视觉冲击,下面是斯坦福教学视频,从平面图形中还原三维、四维的图像(可以从52分钟看起):
http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html
聚类是机器学习常用算法。特别是在智能化要求更高的无监督学习领域,聚类算法更是大展宏图施展拳脚处处留影:
神奇聚类算法的关键在于找到像素间的“共同相似性”,比如像素之间的“距离”:
聚类的作用不仅仅在于分析图像,在所有的复杂系统中,聚类都有特殊意义。通过“聚类”,能够把杂乱无章一团乱麻,整理归纳聚类清分,然后在宏观角度一目了然。
比如下面是纽约时报介绍的阿富汗社会结构情况,第一感觉完全是杂乱无章一团乱麻:
为了突出重点,先把距离远(相关性不强)的元素去掉:
然后,对元素按照特征属性进行归类:
如果我们把不同种类的元素标识不同颜色进行归类,那么即使系统结构复杂,链接线路繁多,我们也能在层次分类之后,看出不同类别之间的简洁关系:
注意,这其实就是聚类算法下的深度学习模型。
通过把基础要素的特征属性归类,我们可以一目了然复杂结构关系。
聚类算法下的深度学习模型,是一种复杂系统普遍适用的结构分析方法。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 08:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社