vcitym的个人博客分享 http://blog.sciencenet.cn/u/vcitym 中国地质大学(北京)教授

博文

大数据摘抄2

已有 3139 次阅读 2012-6-28 06:41 |个人分类:杂谈|系统分类:科研笔记| GIS, 大数据

从“云计算”的原教旨主义角度,目前国内很多“云计算”中心的建设理念却是在背道而驰,因为它们试图采购最好的机器和最高的能源成本来搭建所谓的“云计算”平台,尤其是在东部缺电省份,建设这样的大型“电老虎”将会给运维带来严峻的挑战。“云计算”本身就是一个飘忽不定的东西,你现在要进行定制,真是有问题的。既然是云就应在其飘忽不定中找可以利用的方法和技术。

 

一般认为,云计算平台有两个最关键的问题:一是虚拟化,二是分布式存储和计算模型。虚拟化是一种将硬件软件化的技术,它能够将一台服务器“虚拟”为多台服务器来使用,从而使机器始终在高负荷下运行,充分使用硬件资源。在这样的情况下,探索“云计算”能够给GIS领域带来什么样的机会,可能存在什么样的应用场景就显得特别重要!

 

我们能够使用“云计算”平台来为GIS做些什么?首先,使用分布式文件存储系统来对Map Tile(地图瓦片)进行存储可能是一个最简单的选项;而在分布式数据库之上建构新的GIS数据模型,可能是一个富有挑战性的问题。目前GIS数据模型所使用的各种关系型数据库,本身并不是分布式的。在所有的数据都能使用NoSQL数据库进行管理之后,如何来使用这些数据?如何使用分布式编程模型来解决实际问题?恐怕是更大的问题。“云GIS”平台只是给GIS行业带来了一种全新的数据管理和分析的平台工具,而怎么样来使用这些工具,更需要我们的智慧与想象力。如果我们现在并没有更长远的眼光和规划,只是试图将现有的一切搬迁到“云GIS”之上,那么今天我们遇到的问题,在将来仍然会存在。

 

大数据时代GIS数据分析平台会面临一些挑战。首先,在GIS领域有很多大的价值,现在很多企业倾向于更多的原始数据或者叫云系数据进行周期的保留,但传统UNIX为代表的或者集中式的高端存储,在存储上、性能上都没办法很好的完成性能的需求。另外,在大数据处理上,比如我们在做堵车分析的场景里面,数据的实时更新率是非常高的,我们要求我们的平台必须具有海量计算的能力,来满足实际的应用需求。在这样的环境里面,传统的数据结构、数据架构,可能也很难满足我们这样的处理需求。还有对数据结构的访问需求,现在我们的数据,尤其在GIS领域,它的结构除了传统的数据以外,还有大量复杂的数据。



https://blog.sciencenet.cn/blog-43347-586568.html

上一篇:中国科研项目顺口溜
下一篇:大数据摘抄3
收藏 IP: 152.15.174.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 02:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部