yytdw0的个人博客分享 http://blog.sciencenet.cn/u/yytdw0

博文

磁盘分区误删public导致科研软件不能正常使用

已有 1210 次阅读 2022-11-21 16:13 |个人分类:技术问题|系统分类:科研笔记

前几日给磁盘分区扩容,带来一系列后遗症,发现mndo99科研软件也无法正常运行了,报错说明需要调用public/.....lib文件,经过将近一周的摸索与咨询,问题终于得以解决。

首先,根本原因在于磁盘分区扩容后挂载失败造成的,因为我做了lvm,应该是改变l。

其次,mndo99软件版本比较老旧,正常安装时,configure可以成功,但是 make -j6会报错如下:

image.png究其原因为mndo99软件版本太老,与编译器不匹配。之前在西安交大服务器上使用的老版编译器为:

image.png


一、咨询五舟ASL工程师后,具体解决方案(不全面,只能记录支离破碎的信息):

  1. 重新安装了parallel_studio_xe_2018_update4_cluster_edition.tgz,不给sbd1单独分区挂载了,这一步一定要做好数据备份,可能导致sdb1磁盘数据消失。

  2. 安装mndo99过程可能提示找不到libmkl_intel_lp64.so文件。

  3. find libmkl_intel_lp64.so

  4. module load intel/18.0.3.222

  5. 安装成功后添加环境变量 source /public/apps/intel/parallel_studio_xe_2018/psxevars.sh intel64

  6. 最后工程师提示:少编译一个功能,/configure --disable-scosmo(这个功能没有编译进去),如果以前有编译的运行文件mndo99,直接用之前编译就可以。

  7. 后面我将工程师编译的少一个功能的mndo99复制到/home/server/bin下就可以用了。

二、咨询北京并行超算客服的解决方案:

  1. 使用超算中心部署好的mpi和gcc编译器,发现报错都是一样的,都是configure可以成功,但是make报错。

  2. 后面经过排查发现是编译器与代码不兼容,代码太老,遂换成上述西安交大的15年ifort编译器,安装成功。

  3. 并行客服给编写了脚本,编译的时候加载了编译环境,都写到脚本了。

    image.png

  4. 脚本内容为:

    image.png

总结:

本地购买了服务器:

缺点:出现故障有时很难解决,比较劳心,有时甚至一步卡住,寸步难行。

优点:省钱

购买并行超算机时

优点:解决问题是真的快,服务态度异常好。

缺点:相对烧钱吧。

希望学校的高性能服务器赶快购买好,节省科研人员的不必要的硬件技术时间消耗。




https://blog.sciencenet.cn/blog-3518264-1364690.html

上一篇:Linux系统无法reboot解决方法
收藏 IP: 211.70.208.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-1 10:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部