|||
由于最近正准备一篇云计算在电力系统分析中应用的文章,看了有一定数量的云计算的文章,主要是介绍性的,有几篇具体某一学科上应用的,但在国内的实际应用还罕见。由于目前学术研究才刚起步,更多是网上的新闻报道,推荐一个我们国内的网站,由刘鹏老师组织搭建的“中国云计算” http://www.chinacloud.cn/default.aspx ,站里内容丰富。
但从目前看来,云计算,主要是指公共云计算,虽说是pay-as-you-go的商业模型,还很难为普同科研人员所用,只是美国等少数得到政府支持的研究人员,在MS,IBM,Google这些大公司的配合下,开展一定的测试性研究。同样的事情,在国内没有硬件平台缺乏,软件重视更不足情况下,实是比较难开展的。相比之下,云计算显得更适合于数据的处理(当然,我也希望学术界能在其他领域也利用好CC,自己也争取努力做出些成绩),基于MapReduce分布式性数据存储和处理已经得到大规模应用和实际的肯定。
下面主要想谈一下海量数据的处理问题,这也是最近一段时间所看的资料和与计算科学专家Savas(http://savas.me/)的邮件交流后的体会,特别是他推荐的几篇文章,让我这个学术“小孩子”和计算机领域的“,门外汉”了解到学术发展的新动态,计算机科学的发展为大规模数据的处理提供了可能,这将开始科学发现的新模式——基于大规模密集数据处理的科学发现(data-intensive scientifc discovery),更详细的分析可见Savas推荐的,他与Jim Gray、Tony Hey等合著的一本新书The Fourth Paradigm: Data-Intensive Scientific Discovery(文后附下载地址)
在经历实验式、理论式、仿真式后,科学研究和发现将进入基于大规模数据处理的模式(the following is quoted from Savas’s site : Amongst the many things that Jim talked about was the “Fourth Paradigm in Science”, the fact that scientific research has transitioned from “experimental” (thousands of years go), to “theoretical” (few hundreds years ago), to “computational” (last few decades), to “data-intensive” (today)
在这样的一个大的趋势下,我们该思考如何结合自己学科上、研究项目中的特点,更好地利用计算科学的计算和资源,对研究中的大规模数据进行处理是十分必要的。结合我自己的电力学科,云计算将是未来应对智能电网大量数据处理和用户互动的基础,而云计算的动态优化计算资源的配置将是电网调度和控制中心的计算平台基础,当然这需要EMS和底层的数据库系统支持分布式的并行计算。而地区变电站将可能面对大量分布式电源的接入的调度问题,这是解决问题的云计算将是优先选择;另一个我关注的领域——复杂网络也会是这一趋势下的突出的学科,基于数据分析的复杂网络在更强大的数据处理平台和技术帮助下,将有可能对系统工程产生深远影响。此外,对于学术科研合作,e-Science 和“Science as a Service”的理念和具体实施将改变传统的小范围群体的研究,当然,目前这情况已经在慢慢发生,正如“复杂网络”这个圈子的成立和壮大,希望后面会越来越好。
More can be found here:
Savas:http://savas.me/
Jim Gray:http://research.microsoft.com/en-us/um/people/gray/
Tony Hey :http://www.microsoft.com/presspass/exec/tonyhey/default.aspx
【Book】:The Fourth Paradigm: Data-Intensive Scientific Discovery : http://research.microsoft.com/en-us/collaboration/fourthparadigm/http://research.microsoft.com/en-us/collaboration/fourthparadigm/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 06:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社