|||
VASP 编译的时候可以选择 -O1 -O2 等优化,具体哪种最优还需要实际测试才知道。
今设立同样一个计算任务,在同一台计算机上依次用各种 VASP 的二进制文件测试(均使用六个线程)
1. -O1 优化
Total CPU time used (sec): 1647.020
User time (sec): 1645.420
System time (sec): 1.600
Elapsed time (sec): 1647.455
Maximum memory used (kb): 1697308.
2. -O2 优化
Total CPU time used (sec): 1635.344
User time (sec): 1633.648
System time (sec): 1.696
Elapsed time (sec): 1635.708
Maximum memory used (kb): 1702552.
3. -O3 优化
Total CPU time used (sec): 1637.076
User time (sec): 1635.652
System time (sec): 1.424
Elapsed time (sec): 1637.448
Maximum memory used (kb): 1696324.
4. 自旋-轨道耦合版本,-O1 优化
Total CPU time used (sec): 1647.152
User time (sec): 1645.664
System time (sec): 1.488
Elapsed time (sec): 1647.614
Maximum memory used (kb): 1709676.
结论是 -O2 优化最快,但内存使用得比 -O1 和 -O3 略多。-O3 优化要强于 -O1 优化,速度非常接近 -O2 优化。用于自旋轨道耦合计算的特殊版本,采用了 -O1 优化,计算速度与普通 -O1 优化的差不多,但内存占用更多。实际计算推荐使用 -O2 优化(速度稍微快一点点) 或 -O3 优化(内存占用少)的版本。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 23:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社