薛堪豪的个人博客分享 http://blog.sciencenet.cn/u/bfax 兴趣:凝聚态物理,电化学

博文

VASP 不同编译方法的性能测试

已有 5877 次阅读 2016-7-25 22:28 |个人分类:计算机|系统分类:科研笔记| 第一性原理计算

VASP 编译的时候可以选择 -O1 -O2 等优化,具体哪种最优还需要实际测试才知道。


今设立同样一个计算任务,在同一台计算机上依次用各种 VASP 的二进制文件测试(均使用六个线程)


1. -O1 优化

Total CPU time used (sec):     1647.020

User time (sec):     1645.420

System time (sec):        1.600

Elapsed time (sec):     1647.455  

Maximum memory used (kb):     1697308.


2. -O2 优化

Total CPU time used (sec):     1635.344

User time (sec):     1633.648

System time (sec):        1.696

Elapsed time (sec):     1635.708  

Maximum memory used (kb):     1702552.


3. -O3 优化

Total CPU time used (sec):     1637.076

User time (sec):     1635.652

System time (sec):        1.424

Elapsed time (sec):     1637.448  

Maximum memory used (kb):     1696324.


4. 自旋-轨道耦合版本,-O1 优化

Total CPU time used (sec):     1647.152

User time (sec):     1645.664

System time (sec):        1.488

Elapsed time (sec):     1647.614

Maximum memory used (kb):     1709676.


结论是 -O2 优化最快,但内存使用得比 -O1 和 -O3 略多。-O3 优化要强于 -O1 优化,速度非常接近 -O2 优化。用于自旋轨道耦合计算的特殊版本,采用了 -O1 优化,计算速度与普通 -O1 优化的差不多,但内存占用更多。实际计算推荐使用 -O2 优化(速度稍微快一点点) 或 -O3 优化(内存占用少)的版本。



https://blog.sciencenet.cn/blog-365047-992754.html

上一篇:远程登陆 Ubuntu 服务器
下一篇:i7 平台计算机整机功耗测试
收藏 IP: 27.16.214.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 03:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部