||
Beowulf集群的建立方式
作者:jigger
可以采用的方案还有
PXELINUX 无盘
RAID DHCP NFS NIS 共享
openmpi 并行库
openpbs(torque) maui(free but limited) moab(charged) 作业管理
还有很多自己写脚本(主要是perl)来控制集群。这个完全靠积累了,因为在实际使用中需要的东西非常多。
还有比如系统温度监控,系统安全,通知警报(比如短信和网页显示)等。
这样可以建立一个比较完整的Beowulf Cluster。
当然你编译LAMMPS的时候需要使用openmpi支持,如果你是调用库文件的方式使用LAMMPS,那么gcc也需要使用openmpi支持。
建立好集群,使用方式就是指定使用节点数目,使用CPU数目,这样和单机调用相比就是多了指定使用节点数目而已。
当然,你也可以设计Grid Computation的方式,还有使用自己的一些算法进行流程作业控制,主要是traffic policy, optimization, mission policy。因为关键是并行化希望提高程序效率,简化工作。而算法作业控制这个是对多用户集群来讲非常重要。比如对涌现现象的处理,不同的算法对于提高 集群的用户使用效率区别很大。
PS一下:2.6.20-r9至2.6.29-r5的内核对Diskless都存在bug,网上很多讨论(很多人升级内核以后发现集群不能启动 了:-(),暂时还没有比较好的解决办法。之后版本我没有测试过所以也不知道。我们的集群用的是2.6.20-r8 和 2.6.29-r5 (可以有折中的解决办法)。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-23 22:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社