wtian的个人博客分享 http://blog.sciencenet.cn/u/wtian

博文

推荐《数据中心资源优化调度:理论与实践》一书

已有 7499 次阅读 2014-6-30 22:18 |系统分类:科研笔记| 云计算, 互联网, 计算机, 信息服务, 数据中心


该书已由电子工业出版社2014年4月出版。



以下是其封面、前言和目录:

封面



前言

“经过精细规划的优化理论设计的实践比随意性或一般性实施在性能、节能以及提高运营利润等方面可体现高出多个量级的效果,并不断接近或达到最优化结果。”


云计算是一种计算模型和服务模式,它将计算任务分布在大量计算机构成的不同数据中心,使各种应用系统能够根据需要获取计算能力、存储空间和信息服务。提供资源的网络或数据中心被称为“云”。业界研究者将云计算列为水、电、气、油之外的第五种公用资源(the fifth utility)。继个人计算机变革、互联网变革之后,云计算被看做第三次IT浪潮,是世界和中国战略性新兴产业的重要组成部分,它将带来生活、生产方式和商业模式的深刻改变,已成为当前全社会关注的热点。

云计算目前已经广泛应用于网络搜索、科学计算、虚拟环境、能源和生物信息等领域的日常业务和创新性探索。IDC预测,未来4年中国云计算将产生1.1万亿元的市场。赛迪顾问2010年底的《中国云计算产业发展白皮书》预测未来3年,云计算应用将以政府、电信、教育、医疗、金融、石油石化和电力等行业为重点,在中国市场逐步被越来越多的企业和机构采用,市场规模也将从2009年的92.23亿元增长到2012年的606.78亿元,年均复合增长率达87.4%。该报告预计中国云计算产业发展将分为准备阶段(20072010年)、起飞阶段(20112015年)和成熟阶段(2015年以后)。

不少研究预言“将来的核心竞争在数据中心”。数据中心是容纳计算设备资源的集中之地,同时负责对计算设备的能源提供和空调维护等。数据中心可以单独建设,也可以置于其他建筑之内,还可以是分布在不同地理位置的多个系统。云资源汇聚在一起,通过多租户模式服务多个消费者。在物理上,资源以分布式的共享方式存在,但最终在逻辑上以单一整体的形式呈现给用户。资源种类很多,分类角度也不一样,本书所涉及的资源主要包括以下几类。

l 物理服务器:构成数据中心的物理计算设备,每个物理服务器可以提供多个虚拟机,每个物理服务器可以由多个CPU、内存、硬盘、网卡等构成。

l 物理集群:由多个物理服务器、必要的网络和存储设施构成的物理服务器组。

l 虚拟机:通过虚拟化软件在物理服务器上生成的虚拟计算平台,可以由多个虚拟化CPU、硬盘、网卡等构成。

l 虚拟集群:由多个虚拟机、必要的网络和存储设施构成的虚拟机组。

l 共享存储:为数据中心的计算资源提供大容量存储,可以被所有设备和应用共享。

以上数据中心资源在本书中统称为基础资源,简称云资源。

云资源优化管理调度技术是云计算应用的核心,是云计算得以大规模应用和提高系统性能、兼顾节能减排及运营成本利润等方面的关键技术。先进的动态资源调度管理,对于提高学校、政府、研究机构和企业计算资源的利用效率,节约能源,提高资源共享和降低运营成本都具有极大意义,值得深入系统地学习和研究。

资源管理调度是将资源从资源提供方分配给用户的一个过程。对于资源过载(即需求大于系统容量),以及需求与容量随着时间的推移而动态变化的事实,通过优化资源调度管理,可以动态地重新分配资源,以便更高效地使用可用资源。业界一般将调度分为作业级调度和设施级调度。作业级调度是指针对具体的运行程序,系统将作业具体分配到哪些资源上运行的问题。例如,一些独立的需要较多计算资源和较长运行时间的程序,或者高性能并行处理程序,这些程序往往需要较大规模的高性能计算资源(如云计算)才能很快完成。设施级调度主要指将底层资源作为一种基础设施服务(Infrastructure as a ServiceIaaS)提供给用户,用户依据实际情况使用这些资源。例如,数据中心的物理服务器(含CPU、内存、网络带宽等)、虚拟机(含虚拟化的CPU、内存、网络带宽等)及虚拟集群都属于底层基础资源。

本书侧重于设施级(也称应用级)调度,同时兼顾作业级调度(如MapReduce多任务),并介绍资源动态优化管理与调度。如果把数据中心作为一个整体与人体比较,资源优化管理调度类似人的大脑,是最为核心的功能之一,具有极大的理论意义和实用价值。另外,资源监控类似人的眼睛,资源部署类似人的四肢。目前的数据中心管理与调度大多仅实现了简单的初级功能,还有很多问题亟须深入系统解决。针对基础资源优化管理调度,主要回答以下三大基本问题。

l 优化目标问题:将所需的虚拟机(或虚拟集群)配置在某个数据中心物理服务器(或物理集群)的具体优化函数(目标)是什么?如何建立高效的数学理论优化模型?这涉及宏观的管理策略制定。

l 优化分配问题:具体在哪个数据中心的哪个物理服务器上(或物理集群)分配所需的虚拟机(或虚拟集群)以实现优化目标?满足的具体前提和限制条件有哪些?针对不同的优化目标,业界优化实践方案有哪些?

l 实践性能问题:针对理论优化目标与模型,业界优化管理调度方案的性能对比效果如何?如何选择适合不同目标的具体方法?

“没有理论的实践是盲目的,没有实践的理论是苍白的。”从优化和长远的角度来看,云计算的建设需要坚实的理论与实践经验的结合,我们发现经过精细规划的优化理论设计的实践比随意性或一般性实施在性能、节能以及提高运营利润等方面可体现高出多个量级的效果,并不断接近或达到最优化结果。经过多年的数据中心建设的实践和理论探索,我们在本书中提出并总结相关领域的优化理论模型和实践方法,在解决基本问题的同时,实现动态调度而不是静态预先完全设定相关参数,兼顾资源(CPU、存储、网络等)的性能、热耗、利用率等特性,本书称之为资源的动态综合调度技术问题。

数据中心需要处理物理和虚拟资源的动态结合的优化管理调度这一新问题,以实现高性能、节能减排及降低投资等目标。当前数据中心的资源调度不少仍然沿袭传统方法,较为简单化,难以满足以上目标的精细化和动态变化的要求。数据中心调度面临的挑战性问题包括:在考虑配置动态可调虚拟机的分配和迁移以及物理机综合性能,同时兼顾CPU、存储、网络等资源因素而非单一因素的情况下,如何解决用户需求不一致和资源规格不一致造成的系统性能不平衡、能耗效率低下及成本过高等问题。

本书围绕以上关键问题展开,介绍了主要云服务提供商的相关解决方案和国内外研究现状,以及对以上挑战性问题的理论与实践探索,希望为读者深入了解相关知识内容和有兴趣的研究人员提供一些借鉴。

本书各章之间的关系紧密围绕云资源优化管理调度展开,如下图所示。本书主要内容包括云计算概述(第1章)、数据中心(第2章)、大数据处理(第3章)、云资源监控管理(第4章)、实时负载均衡调度(第5章)、节能调度概述(第6章)、离线和在线节能调度算法(第7章)、Hadoop集群节能调度管理(第8章)、计算资源的利润(第9章)、云工作流应用(10)、数据中心调度模拟系统(第11章),以及总结与展望(第12章)。本书可作为高年级本科生和研究生教材,也可作为相关专业研究人员的参考资料。


目录:

目  录

 

第1章  云计算概述·· 1

1.1  云计算发展背景·· 2

1.2  云计算是集大成者·· 4

1.2.1  并行计算·· 5

1.2.2  网格计算·· 6

1.2.3  效用计算·· 7

1.2.4  普适计算·· 7

1.2.5  SaaS· 8

1.2.6  虚拟化技术·· 8

1.3  云计算的驱动因素·· 9

1.3.1  云计算发展现状和趋势·· 11

1.3.2  云计算应用初步分类·· 14

1.4  云计算产业链中的不同角色·· 16

1.5  云计算的主要特征和技术挑战·· 17

1.5.1  云计算的主要特征·· 17

1.5.2  挑战性问题·· 18

1.6  小结·· 19

思考题·· 20

参考文献·· 20

第2章  数据中心·· 22

2.1  数据中心概述·· 23

2.1.1  数据中心简介·· 23

2.1.2  数据中心的需求和挑战·· 24

2.2  云计算数据中心资源调度需求分析·· 25

2.2.1  技术需求·· 25

2.2.2  技术目标·· 27

2.3  云计算数据中心资源调度研究进展·· 28

2.4  云计算数据中心资源调度方案分析·· 29

2.4.1  Google解决方案·· 29

2.4.2  Amazon解决方案·· 30

2.4.3  IBM解决方案·· 32

2.4.4  HP解决方案·· 34

2.4.5  VMware解决方案·· 36

2.4.6  其他厂家解决方案·· 37

2.5  云计算数据中心资源调度标准进展·· 39

2.6  云资源管理调度关键技术及研究热点·· 41

2.7  小结·· 44

思考题·· 44

参考文献·· 44

第3章  大数据处理·· 46

3.1  大数据的发展背景及定义·· 47

3.2  大数据问题·· 50

3.2.1  速度方面的问题·· 51

3.2.2  种类及架构问题·· 52

3.2.3  体量及灵活性问题·· 52

3.2.4  成本问题·· 53

3.2.5  价值挖掘问题·· 54

3.2.6  存储及安全问题·· 54

3.2.7  互连互通与数据共享问题·· 56

3.3  大数据与云计算的辩证关系·· 57

3.4  大数据技术·· 58

3.4.1  基础架构支持·· 60

3.4.2  数据采集·· 62

3.4.3  数据存储·· 63

3.4.4  数据计算·· 67

3.4.5  数据展现与交互·· 75

3.5  ·· 77

思考题·· 78

参考文献·· 78

第4章  云资源监控管理·· 82

4.1  云数据中心监控系统概述·· 83

4.1.1  研究背景·· 83

4.1.2  云数据中心资源监控的方式·· 85

4.1.3  虚拟机监控简介·· 86

4.2  云数据中心监控系统的相关研究·· 89

4.2.1  云数据中心监控系统的功能需求分析·· 89

4.2.2  实现云监控系统的关键技术·· 92

4.3  云数据中心计算资源监控系统的设计与实现·· 96

4.3.1  云数据中心计算资源监控系统的设计·· 97

4.3.2  云数据中心计算资源监控系统的实现·· 101

4.4  云数据中心监控系统数据分析·· 108

4.4.1  用户请求展示·· 108

4.4.2  用排队论分析用户请求·· 109

4.4.3  云数据中心的功耗计算·· 110

4.5  云资源监控系统的性能分析与评价·· 113

4.6  小结·· 120

思考题·· 121

参考文献·· 121


第5章  实时负载均衡调度·· 124

5.1 引言·· 125

5.2 相关工作·· 126

5.2.1  例说明·· 126

5.2.2  问题描述和模型建立·· 127

5.2.3  负载均衡调度算法的度量指标·· 129

5.3 OLRSA算法·· 131

5.4 算法性能比较·· 134

5.4.1  模拟设置·· 134

5.4.2  模拟仿真的结果和分析·· 135

5.5 小结·· 141

思考题·· 142

参考文献·· 142

第6章  计算资源节能调度概述·· 144

6.1  数据中心节能研究背景·· 145

6.1.1  国内外研究背景介绍·· 147

6.1.2  国内外主要参考文献·· 148

6.2  数据中心能耗模型·· 151

6.2.1  数据中心调度系统·· 151

6.2.2  数据中心能耗评估·· 152

6.2.3  服务器能耗模型·· 153

6.3  节能问题描述与建模·· 155

6.3.1  前置条件·· 155

6.3.2  主要节能调度算法分类·· 156

6.4  离线调度算法·· 158

6.4.1  同构且请求容量为单位容量·· 158

6.4.2  同构且请求容量为任意容量·· 159

6.5  在线调度算法·· 160

6.6  随机调度算法·· 160

6.6.1  M/M/1排队模型·· 160

6.6.2  M/M/k排队模型·· 160

6.7  节能调度算法评估·· 161

6.7.1  理论分析证明·· 161

6.7.2  模拟对比分析·· 162

6.8  小结·· 170

思考题·· 171

参考文献·· 172

第7章  计算资源节能调度概述·· 175

7.1  离线节能调度算法·· 176

7.1.1  MFFDE算法分析·· 176

7.1.2  MFFDE算法的近似度证明·· 177

7.2  在线节能调度算法·· 180

7.2.1  BFF算法分析与近似度证明·· 180

7.2.2  BFF算法性能评估·· 185

7.3  MinTBT问题及节能调度算法在数据中心节能中的应用·· 189

7.4  小结·· 190

思考题·· 190

参考文献·· 190

第8章  计算资源节能调度概述·· 192

8.1  Hadoop介绍·· 193

8.1.1  Hadoop简介·· 194

8.1.2  Hadoop框架·· 195

8.1.3  Hadoop运行流程·· 197

8.2  新型动态负反馈调度算法·· 198

8.2.1  Hadoop集群动态管理设计特点·· 198

8.2.2  负载模型设计·· 199

8.2.3  DANF算法设计与实现·· 200

8.2.4  动态调度模块算法伪代码·· 202

8.3  节能调度系统设计·· 203

8.3.1  系统总体架构·· 203

8.3.2  模块详细设计·· 204

8.4  系统测试和分析·· 207

8.4.1  测试环境·· 207

8.4.2  程序功能性测试·· 207

8.4.3  性能测试·· 208

8.5  Hadoop其他节能方式·· 212

8.6  小结·· 213

思考题·· 213

参考文献·· 213

第9章  计算资源的利润 最大化问题·· 216

9.1  计算资源作为服务的利润最大化·· 217

9.1.1  云计算与数据中心·· 217

9.1.2  数据中心的发展·· 220

9.2  传统的最大化利润解决方法·· 221

9.2.1  经典的0-1背包问题·· 221

9.2.2  动态规划法·· 221

9.2.3  贪婪算法·· 222

9.2.4  回溯法·· 222

9.3  区间调度问题介绍·· 223

9.4  带权区间调度·· 224

9.4.1  传统的带权区间调度问题·· 224

9.4.2  WIS中的可相互兼容区间·· 224

9.4.3  带权区间调度问题·· 225

9.5  考虑容量共享的带权区间调度·· 227

9.5.1  考虑容量共享的带权区间调度问题·· 227

9.5.2  WISWCS问题中可相互共享兼容的区间·· 227

9.5.3  WISWCS问题中的容量分割·· 227

9.5.4  WISWCS问题中的权值与容量成比例·· 228

9.5.5  最大化利润的公式·· 229

9.5.6  一种考虑容量共享的准确调度算法·· 230

9.5.7  SAWIS算法找出最佳子集·· 231

9.6  可共享容量调度问题的应用·· 233

9.6.1  云计算中的虚拟机调度·· 233

9.6.2  通信链路共享·· 233

9.6.3  性能评估·· 234

9.7  相关工作·· 235

9.8  小结·· 236

思考题·· 236

参考文献·· 236

第10章  云工作流应用·· 238

10.1  科学计算云平台研究背景·· 239

10.2  工作流和云平台集成的相关研究工作·· 241

10.3  科学计算云平台的结构化方案·· 242

10.3.1  需求·· 242

10.3.2  架构·· 243

10.3.3  集成选项·· 244

10.3.4  实现细节·· 248

10.4  科学计算云平台集群配置和产品部署·· 252

10.4.1  MODIS图片处理工作流·· 252

10.4.2  产品部署·· 256

10.5  小结·· 258

思考题·· 259

参考文献·· 259

第11章  数据中心调度模拟系统·· 263

11.1  引言·· 264

11.2  CloudSched的架构和主要特点·· 265

11.2.1  数据中心的建模·· 268

11.2.2  虚拟机分配的建模·· 268

11.2.3  用户请求建模·· 269

11.3  不同调度算法的性能度量·· 270

11.3.1  多维度负载均衡的度量指标·· 270

11.3.2  节能算法的度量指标·· 272

11.3.3  种最大化资源利用率的度量指标·· 273

11.3.4  置信区间的度量·· 273

11.4  CloudSched的设计与实现·· 274

11.4.1  数据中心的调度过程·· 274

11.4.2  调度算法——以LIF算法为例·· 274

11.5  性能评估·· 277

11.5.1 储器负载均衡比较·· 278

11.5.2  节能效果比较·· 279

11.6  小结·· 280

参考文献·· 281

 

 




https://blog.sciencenet.cn/blog-1028294-807973.html

上一篇:重温《师说》,兼谈教学科研与服务
下一篇:我们攻克了计算机理论领域最难题?NP=P!
收藏 IP: 221.237.41.*| 热度|

2 谢刚 Vetaren11

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-27 09:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部