高塔星辰分享 http://blog.sciencenet.cn/u/jigger 荒野中跋涉的剑客 银塔里的占星师 蒸気城の機械のエンジニア

博文

Beowulf集群的建立方式

已有 5812 次阅读 2009-9-29 18:16 |个人分类:iOS/Android/Linux|系统分类:科研笔记

Beowulf集群的建立方式

作者:jigger

 可以采用的方案还有
  PXELINUX 无盘
  RAID DHCP NFS NIS 共享
  openmpi 并行库
  openpbs(torque) maui(free but limited) moab(charged) 作业管理
  还有很多自己写脚本(主要是perl)来控制集群。这个完全靠积累了,因为在实际使用中需要的东西非常多。
  还有比如系统温度监控,系统安全,通知警报(比如短信和网页显示)等。
  这样可以建立一个比较完整的Beowulf Cluster。
  当然你编译LAMMPS的时候需要使用openmpi支持,如果你是调用库文件的方式使用LAMMPS,那么gcc也需要使用openmpi支持。
  建立好集群,使用方式就是指定使用节点数目,使用CPU数目,这样和单机调用相比就是多了指定使用节点数目而已。
  当然,你也可以设计Grid Computation的方式,还有使用自己的一些算法进行流程作业控制,主要是traffic policy, optimization, mission policy。因为关键是并行化希望提高程序效率,简化工作。而算法作业控制这个是对多用户集群来讲非常重要。比如对涌现现象的处理,不同的算法对于提高 集群的用户使用效率区别很大。
  PS一下:2.6.20-r9至2.6.29-r5的内核对Diskless都存在bug,网上很多讨论(很多人升级内核以后发现集群不能启动 了:-(),暂时还没有比较好的解决办法。之后版本我没有测试过所以也不知道。我们的集群用的是2.6.20-r8 和 2.6.29-r5 (可以有折中的解决办法)。



https://blog.sciencenet.cn/blog-303817-258707.html

上一篇: 搜狐开源镜像网站
下一篇:凯尔特(CELTIC)音乐
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 00:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部